Détection des logiciels malveillants dans les modèles d'IA avec MetaDefender

Why malicious AI models are the next frontier in supply chain attacks—and how MetaDefender Aether exposes their hidden payloads.

Oct 20, 2025 par OPSWAT

Partager cet article

L'intelligence artificielle fait désormais partie de la vie quotidienne. Selon IDC, les dépenses mondiales en systèmes d'IA devraient dépasser les 300 milliards de dollars d'ici 2026, ce qui montre à quel point l'adoption s'accélère. L'IA n'est plus une technologie de niche : elle façonne le mode de fonctionnement des entreprises, des gouvernements et des particuliers.

Les développeurs de Software intègrent de plus en plus la fonctionnalité des grands modèles de langage (LLM) dans leurs applications. Des LLM bien connus tels que ChatGPT d'OpenAI, Gemini de Google et LLaMA de Meta sont désormais intégrés dans des plateformes commerciales et des outils grand public. Des chatbots d'assistance à la clientèle aux logiciels de productivité, l'intégration de l'IA permet d'améliorer l'efficacité, de réduire les coûts et de maintenir la compétitivité des entreprises.

Mais toute nouvelle technologie s'accompagne de nouveaux risques. Plus nous nous appuyons sur l'IA, plus elle devient une cible attrayante pour les attaquants. Une menace en particulier prend de l'ampleur : les modèles d'IA malveillants, des fichiers qui ressemblent à des outils utiles mais qui cachent des dangers.

Le risque caché des modèles pré-entraînés

L'entraînement d'un modèle d'IA à partir de zéro peut prendre des semaines, nécessiter des ordinateurs puissants et d'énormes ensembles de données. Pour gagner du temps, les développeurs réutilisent souvent des modèles pré-entraînés partagés par des plateformes telles que PyPI, Hugging Face ou GitHub, généralement dans des formats tels que Pickle et PyTorch.

À première vue, cette démarche est tout à fait logique. Pourquoi réinventer la roue si un modèle existe déjà ? Mais voilà le hic : tous les modèles ne sont pas sûrs. Certains peuvent être modifiés pour dissimuler du code malveillant. Au lieu de simplement aider à la reconnaissance vocale ou à la détection d'images, ils peuvent exécuter discrètement des instructions nuisibles dès qu'ils sont chargés.

Les fichiers Pickle sont particulièrement risqués. Contrairement à la plupart des formats de données, Pickle peut stocker non seulement des informations, mais aussi du code exécutable. Cela signifie que les attaquants peuvent dissimuler un logiciel malveillant à l'intérieur d'un modèle qui semble tout à fait normal, offrant ainsi une porte dérobée cachée par le biais de ce qui semble être un composant d'intelligence artificielle de confiance.

De la recherche aux attaques réelles

Avertissements précoces - Un risque théorique

L'idée que les modèles d'IA puissent être détournés pour diffuser des logiciels malveillants n'est pas nouvelle. Dès 2018, des chercheurs ont publié des études telles que Model-Reuse Attacks on Deep Learning Systems montrant que des modèles pré-entraînés provenant de sources non fiables pouvaient être manipulés pour se comporter de manière malveillante.

Au départ, il s'agissait d'une expérience de pensée, d'un scénario "et si" débattu dans les cercles universitaires. Nombreux étaient ceux qui pensaient qu'il s'agirait d'un sujet trop spécialisé pour avoir de l'importance. Mais l'histoire montre que toute technologie largement adoptée devient une cible, et l'IA n'a pas fait exception.

Preuve de concept - Rendre le risque réel

Le passage de la théorie à la pratique s'est produit lorsque des exemples réels de modèles d'IA malveillants ont fait surface, démontrant que les formats basés sur Pickle, comme PyTorch, peuvent intégrer non seulement les poids des modèles, mais aussi le code exécutable.

Un cas frappant est celui de star23/baller13, un modèle téléchargé sur Hugging Face au début du mois de janvier 2024. Il contenait un shell inversé caché dans un fichier PyTorch et son chargement pouvait donner aux attaquants un accès à distance tout en permettant au modèle de fonctionner comme un modèle d'IA valide. Cela montre que les chercheurs en sécurité testaient activement des preuves de concept à la fin de l'année 2023 et au début de l'année 2024.

Capture d'écran de l'interface utilisateur montrant un avertissement sur la détection de logiciels malveillants dans les modèles d'IA avec un fichier analysé comme dangereux et un avertissement sur les métadonnées YAML — Modèle de PoC sur le visage étreint

Capture d'écran d'un code Python montrant des commandes shell inversées, illustrant la détection de logiciels malveillants dans des modèles d'IA pour la preuve de concept. — Reverse Shell intégré dans Pytorch

En 2024, le problème n'était plus isolé. JFrog a signalé plus de 100 modèles malveillants d'IA/ML téléchargés sur Hugging Face, confirmant que cette menace était passée de la théorie à des attaques réelles.

Attaques contre la Supply Chain - des laboratoires à la vie sauvage

Les attaquants ont également commencé à exploiter la confiance établie dans les écosystèmes logiciels. En mai 2025, de faux paquets PyPI tels que aliyun-ai-labs-snippets-sdk et ai-labs-snippets-sdk ont imité la marque d'IA d'Alibaba pour tromper les développeurs. Bien qu'ils soient restés en ligne moins de 24 heures, ces paquets ont été téléchargés environ 1 600 fois, ce qui montre la rapidité avec laquelle les composants d'IA empoisonnés peuvent s'infiltrer dans la chaîne d'approvisionnement.

Pour les responsables de la sécurité, cela représente une double exposition :

Perturbation opérationnelle si des modèles compromis empoisonnent les outils commerciaux alimentés par l'IA.
Risque en matière de réglementation et de conformité si l'exfiltration des données se produit par l'intermédiaire de composants fiables mais troyens.

Page du paquet SDK Python montrant la sécurité de la chaîne d'approvisionnement et les scores de vulnérabilité pour la détection de logiciels malveillants dans les modèles d'IA. — Exemple de paquets PyPi malveillants 1

Capture d'écran de l'interface utilisateur montrant l'alerte de risque de la chaîne d'approvisionnement pour la détection de logiciels malveillants dans les modèles d'IA dans un kit de développement logiciel Python. — Exemple de paquets PyPi malveillants 2

Explorateur de fichiers montrant un paquet PyPi compromis avec un fichier model.pt suspect, illustrant la détection de logiciels malveillants dans les modèles d'intelligence artificielle. — Exemple de paquets PyPi malveillants 3

Evasion avancée - Déjouer les défenses traditionnelles

Une fois que les attaquants ont vu le potentiel, ils ont commencé à expérimenter des moyens de rendre les modèles malveillants encore plus difficiles à détecter. Un chercheur en sécurité connu sous le nom de coldwaterq a démontré comment la nature "Stacked Pickle" pouvait être utilisée de manière abusive pour cacher du code malveillant.

En injectant des instructions malveillantes entre plusieurs couches d'objets Pickle, les attaquants pouvaient enfouir leur charge utile de manière à ce qu'elle paraisse inoffensive aux scanners traditionnels. Lorsque le modèle était chargé, le code caché se décomposait lentement, étape par étape, révélant son véritable objectif.

L'interface utilisateur de l'analyse de sécurité montre que 0 fournisseur sur 62 a détecté un logiciel malveillant dans le fichier du modèle d'IA, ce qui met en évidence l'évasion de la détection. — Non détecté sur VirusTotal

Il en résulte une nouvelle catégorie de menaces IA pour la chaîne d'approvisionnement, à la fois furtives et résistantes. Cette évolution souligne la course aux armements entre les attaquants qui innovent de nouvelles astuces et les défenseurs qui développent des outils pour les démasquer.

How MetaDefender Aether detections help preventing AI attacks

As attackers improve their methods, simple signature scanning is no longer enough. Malicious AI models can use encoding, compression, or Pickle quirks to hide their payloads. MetaDefender Aether addresses this gap with deep, multi-layered analysis built specifically for AI and ML file formats.

Exploiter les outils de numérisation Pickle intégrés

MetaDefender Aether integrates Fickling with custom OPSWAT parsers to break down Pickle files into their components. This allows defenders to:

Inspecter les importations inhabituelles, les appels de fonction non sécurisés et les objets suspects.
Identifier les fonctions qui ne devraient jamais apparaître dans un modèle d'IA normal (par exemple, les communications réseau, les routines de cryptage).
Générer des rapports structurés pour les équipes de sécurité et les flux de travail du SOC.

L'interface utilisateur de l'outil Fickling affichant un verdict malveillant pour la détection de logiciels malveillants dans les modèles d'IA à l'aide de l'analyse pickle — Obtenu le verdict de l'analyse de Fickling

L'analyse met en évidence plusieurs types de signatures qui peuvent indiquer un fichier Pickle suspect. Elle recherche des modèles inhabituels, des appels de fonction non sécurisés ou des objets qui ne correspondent pas à l'objectif d'un modèle d'IA normal.

Capture d'écran de l'interface utilisateur montrant la détection de logiciels malveillants dans le fichier pickle du modèle d'IA avec le verdict malveillant et les importations Python non sûres répertoriées. — L'analyse a trouvé un indice intéressant dans un cornichon

Dans le contexte de la formation à l'IA, un fichier Pickle ne doit pas nécessiter de bibliothèques externes pour l'interaction avec les processus, la communication réseau ou les routines de cryptage. La présence de telles importations est un indicateur fort d'intention malveillante et doit être signalée lors de l'inspection.

Interface utilisateur montrant les résultats de l'analyse du fichier pickle pour la détection des logiciels malveillants dans les modèles d'IA, listant les importations et les appels de fonction suspects — Le fichier Pickle appelle une fonction

Analyse statique approfondie

Au-delà de l'analyse syntaxique, le bac à sable désassemble les objets sérialisés et retrace leurs instructions. Par exemple, l'opcode REDUCEde Pickle , quipeut exécuter des fonctions arbitraires pendant le décompactage, est soigneusement inspecté. Les attaquants abusent souvent de REDUCE pour lancer des charges utiles cachées, et le bac à sable signale toute utilisation anormale.

Threat actors often hide the real payload behind extra encoding layers. In recent PyPI supply-chain incidents, the final Python payload was stored as a long base64 string, MetaDefender Aether automatically decodes and unpacks these layers to reveal the actual malicious content.

Capture d'écran de l'interface utilisateur montrant l'analyse statique approfondie détectant les logiciels malveillants dans les modèles d'IA via le fichier pickle REDUCE opcode warning and code output — Exécution d'un code arbitraire contenant une charge utile codée

Capture d'écran de l'interface utilisateur montrant le verdict de l'analyse statique approfondie d'un fichier pickle malveillant pour la détection des logiciels malveillants dans les modèles d'IA — Le fichier Pickle exécute des commandes encodées en base64

Capture d'écran du code Python montrant l'analyse statique pour la détection des logiciels malveillants dans les modèles d'IA, pertinente pour l'analyse statique approfondie. — Charge utile après décodage. (Se trouve dans la section "Extracted Files" du rapport de la sandbox de MD)

Découvrir les techniques d'évasion délibérée

L'empilement d'objets Pickle peut être utilisé comme une astuce pour dissimuler un comportement malveillant. En imbriquant plusieurs objets Pickle et en injectant la charge utile à travers les couches, puis en la combinant avec la compression ou l'encodage. Chaque couche semble inoffensive en soi, de sorte que de nombreux scanners et inspections rapides passent à côté de la charge utile malveillante.

MetaDefender Aether peels those layers one at a time: it parses each Pickle object, decodes or decompresses encoded segments, and follows the execution chain to reconstruct the full payload. By replaying the unpacking sequence in a controlled analysis flow, the sandbox exposes the hidden logic without running the code in a production environment.

Pour les RSSI, le résultat est clair : les menaces cachées sont mises en évidence avant que les modèles empoisonnés n'atteignent vos pipelines d'IA.

L'interface utilisateur de détection des logiciels malveillants met en évidence les techniques d'évasion des modèles d'IA à l'aide de fichiers pickle, de verdicts et d'analyses de codes suspects. — Le fichier Pickle peut exécuter une charge utile via l'opcode REDUCE

Conclusion

Les modèles d'IA sont en train de devenir les éléments constitutifs des logiciels modernes. Mais comme tout composant logiciel, ils peuvent être utilisés à des fins militaires. La combinaison d'une grande confiance et d'une faible visibilité en fait des véhicules idéaux pour les attaques contre la chaîne d'approvisionnement.

Comme le montrent les incidents réels, les modèles malveillants ne sont plus hypothétiques : ils sont là, maintenant. Leur détection n'est pas triviale, mais elle est essentielle.

MetaDefender Aether provides the depth, automation, and precision needed to:

Détecter les charges utiles cachées dans les modèles d'IA préformés.
Découvrez des tactiques d'évasion avancées invisibles pour les anciens scanners.
Protéger les pipelines MLOps, les développeurs et les entreprises contre les composants empoisonnés.

Organizations across critical industries already trust OPSWAT to defend their supply chains. With MetaDefender Aether, they can now extend that protection into the AI era, where innovation doesn’t come at the cost of security.

Learn more about MetaDefender Aether and see how it detects threats hidden in AI models.

Parler à un expert

Indicateurs de compromis (IOC)

star23/baller13: pytorch_model.bin
SHA256: b36f04a774ed4f14104a053d077e029dc27cd1bf8d65a4c5dd5fa616e4ee81a4

ai-labs-snippets-sdk: model.pt
SHA256: ff9e8d1aa1b26a0e83159e77e72768ccb5f211d56af4ee6bc7c47a6ab88be765

aliyun-ai-labs-snippets-sdk: model.pt
SHA256: aae79c8d52f53dcc6037787de6694636ecffee2e7bb125a813f18a81ab7cdff7

coldwaterq_inject_calc.pt
SHA256: 1722fa23f0fe9f0a6ddf01ed84a9ba4d1f27daa59a55f4f61996ae3ce22dab3a

Serveurs C2
hxxps[://]aksjdbajkb2jeblad[.]oss-cn-hongkong[.]aliyuncs[.]com/aksahlksd

IPs
136.243.156.120
8.210.242.114

Tags :

Analyse des logiciels malveillants

Derniers messages

S'inscrire à la lettre d'information OPSWAT

Obtenez les dernières mises à jour de la société OPSWAT ainsi que des informations sur les événements et les nouvelles qui font avancer l'industrie OPSWAT les nouvelles qui font avancer l'industrie.

Signez-moi

Suivez-nous sur les réseaux sociaux Media

Suivez OPSWAT sur LinkedIn, Facebook, Twitter et YouTube pour en savoir plus !

Restez à jour avec OPSWAT!

Inscrivez-vous dès aujourd'hui pour recevoir les dernières mises à jour de l'entreprise, de l'entreprise, des histoires, des informations sur les événements, et plus encore.