Transmission des journaux, des alertes et des données de télémétrie via une diode de données

Découvrez comment
Nous utilisons l'intelligence artificielle pour les traductions de sites et, bien que nous nous efforcions d'être précis, il se peut que les traductions ne soient pas toujours exactes à 100 %. Nous vous remercions de votre compréhension.

Les règles de détection des failles « zero-day » que l'IA ne peut pas réécrire

MetaDefender et Predictive Alin AI fondent la détection des logiciels malveillants sur des invariants valables tant dans les environnements OT que dans les infrastructures critiques
Par OPSWAT
Partager cet article

Pourquoi le secteur de la cybersécurité est-il pris dans un cycle de réaction

Le secteur de la cybersécurité est en perpétuelle réaction. Chaque trimestre apporte son lot de nouvelles menaces, de nouvelles techniques de contournement et de nouveaux acronymes censés redéfinir la défense. Cela place les RSSI et les directeurs techniques, chargés de prendre des décisions à long terme concernant l’infrastructure, face à un paradoxe : les stratégies de détection doivent rester pertinentes pendant cinq à dix ans, alors même que le paysage des menaces évolue tous les quelques mois. La mise en place de défenses multicouches est donc indispensable. La question qui reste en suspens est de savoir sur quoi ancrer ces couches pour qu'elles résistent à l'évolution des menaces.

Pour élaborer une stratégie durable, il faut aller au-delà des changements observés dans le paysage des menaces et identifier ce qui ne change pas : les contraintes sous-jacentes qui continuent de déterminer le comportement des menaces, quelle que soit l'évolution des outils. Ces invariants offrent aux défenses multicouches un ancrage solide, permettant ainsi à l'architecture de détection de rester pertinente malgré l'évolution des menaces et des techniques spécifiques. Dans cet article, nous nous concentrons sur trois de ces invariants, car ce sont eux qui ont l'impact le plus direct sur la manière dont les pipelines de détection modernes doivent être conçus.

Les infrastructures critiques ne peuvent pas se permettre d'attendre que les problèmes surviennent

Dans les environnements OT et d'infrastructures critiques, les systèmes ne sont pas mis à jour rapidement ; les mises à jour sont souvent gérées par les fournisseurs, et les temps d'arrêt ont des répercussions sur l'exploitation. Lorsqu'un fichier malveillant pénètre dans cet environnement, il reste rarement isolé. De nombreuses méthodes de détection reposent encore sur des hypothèses qui ne tiennent pas la route dans ces conditions :

  • Les menaces ressembleront à ce que l'on a déjà vu
  • L'inspection statique permet de déterminer pleinement l'intention
  • Un retard dans l'analyse constitue un compromis acceptable

Les invariants révèlent une réalité différente :

  • Des menaces inconnues continueront d'apparaître
  • Une analyse comportementale est nécessaire pour mettre en évidence l'intention
  • La rapidité de la détection influe sur les résultats en matière de confinement
  • La détection à signaux multiples est plus performante que la détection à moteur unique
  • Les systèmes de détection doivent générer leurs propres informations

C'est dans cet écart entre les idées reçues et la réalité que les pirates informatiques agissent avec le plus d'efficacité. La section suivante commence par la première constante qui met systématiquement cet écart en évidence.

Principe n° 1 : les adversaires s'adapteront toujours plus vite que les défenses statiques

La défense statique n'est qu'une illusion temporaire. Les attaquants analysent la logique de détection, partagent leurs techniques de contournement et perfectionnent sans cesse leurs méthodes. Une fois déployée et laissée telle quelle, aucune technologie défensive ne reste efficace très longtemps face à un adversaire déterminé. C'est le cas depuis la mise en place du premier bac à sable, et les logiciels malveillants générés par l'IA ne font qu'accélérer ce cycle.

En pratique, cela signifie que les logiciels malveillants furtifs n'ont pas besoin de contourner toutes les couches de détection. Il leur suffit de contourner celle sur laquelle vous comptez. Les variantes peuvent désormais être produites plus rapidement, testées face aux mesures de défense et affinées dans le cadre de cycles itératifs. Ce qui prenait autrefois des semaines de développement peut désormais se faire en quelques heures.

Pourquoi les environnements OT absorbent-ils les dommages en premier ?

Dans les environnements OT, le problème d'adaptation s'aggrave. Les cycles de correctifs sont longs, les systèmes sont souvent contrôlés par les fournisseurs, et les logiciels sont déployés via des mises à jour de micrologiciels, des packages fournis par les fournisseurs et des outils de terrain difficiles à remplacer. Ces mêmes fichiers constituent des vecteurs de diffusion idéaux, car ils sont attendus, jugés fiables et difficiles à inspecter sans perturber les opérations.

Certains de ces fichiers peuvent être nettoyés, tandis que d'autres ne le peuvent pas. Les fichiers exécutables, les images de micrologiciel et les fichiers de correctifs doivent fonctionner comme prévu, ce qui limite les cas où le désarmement et la reconstruction du contenu peuvent être appliqués. Il en résulte un éventail plus restreint de méthodes d'inspection viables, et l'inspection statique devient souvent le contrôle par défaut dans bon nombre de ces environnements, même si c'est précisément cette approche que les attaquants ont appris à contourner.

Comment l'émulation au niveau des instructions supprime l'avantage lié au contournement

Le sandboxing traditionnel basé sur des machines virtuelles joue toujours un rôle, mais il crée des conditions que les pirates ont appris à exploiter. Les techniques de contournement permettent de détecter les environnements virtualisés, de retarder l'exécution ou de modifier le comportement en fonction des signaux d'analyse. Dans de nombreux cas, l'analyse intervient également après que le fichier a déjà atteint le terminal, transformant ainsi la détection en simple confirmation plutôt qu'en mesure préventive.

MetaDefender résout ce problème en abandonnant la technique de déclenchement dépendante des machines virtuelles au profit d'une analyse dynamique basée sur l'émulation. Grâce à l'émulation au niveau des instructions, le pipeline de détection exécute les fichiers dans un environnement contrôlé qui ne révèle pas les traces sur lesquelles les logiciels malveillants s'appuient généralement pour échapper à la détection. Les contrôles anti-VM ne trouvent aucun élément permettant d'identifier le logiciel, les chemins d'exécution différés sont observés et les charges utiles en plusieurs étapes peuvent se déployer.

Sandbox traditionnelle Sandbox analyse dynamique MetaDefender

Sandbox traditionnelle basée sur une machine virtuelle

MetaDefender

Résistance à l'évasion

Vulnérable aux attaques anti-VM, aux attaques par timing et aux vérifications de l'environnement

L'émulation au niveau des instructions permet de contourner les mécanismes anti-VM et les techniques de contournement basées sur le délai

Types de fichiers pris en charge

En quantité limitée

Plus de 50 types de fichiers, notamment des fichiers exécutables, des scripts, des fichiers de correctifs et des programmes d'installation

Résultat du verdict

Résultat d'un seul bac à sable

Verdict unifié combinant l'évaluation de la réputation, l'analyse dynamique, la notation des menaces et la recherche active de menaces

Vitesse

10 à 15 minutes par fichier

En temps quasi réel ; plus de 25 000 analyses par jour et par serveur

Déploiement

Dans la plupart des cas, Cloud

Sur site, dans le cloud ou en mode hybride

Production de renseignements

Extraction limitée des IOC

Les indicateurs de compromission comportementaux sont réinjectés dans le pipeline de détection et servent à réentraîner le système d'IA prédictive Alin

En pratique, cela permet de mettre en évidence le comportement d'un fichier plutôt que son apparence. Le chemin d'exécution complet devient visible, quelle que soit la logique de contournement intégrée à l'échantillon. Pour les types de fichiers qui ne peuvent pas être nettoyés, tels que les exécutables, les fichiers de correctifs, les scripts et les programmes d'installation, ce type d'analyse dynamique constitue le moyen le plus fiable de déterminer l'intention du fichier avant qu'il ne pénètre plus profondément dans l'environnement.

Une agence gouvernementale spécialisée dans la criminalistique l'a démontré en conditions réelles. Elle avait pour mission d'analyser des fichiers saisis sur des appareils suspects, dont beaucoup contenaient des logiciels malveillants profondément enfouis dans des formats qui ne peuvent être modifiés sans compromettre leur valeur probatoire. L'agence a remplacé les antivirus traditionnels et l'examen manuel par une analyse multi-scans associée à un environnement de test basé sur l'émulation. Des fichiers dont la vérification prenait auparavant des heures ont pu être analysés en quelques minutes, et des menaces qui échappaient aux outils basés sur les signatures ont été détectées grâce à l'analyse comportementale, sans compromettre l'intégrité des preuves.

Il reste toutefois une contrainte qu’il convient de souligner. Une analyse approfondie améliore la visibilité, mais elle ralentit le processus décisionnel. Si chaque fichier inconnu doit faire l’objet d’une inspection complète avant qu’une conclusion ne soit tirée, la latence s’installe dans l’architecture, et les attaquants chercheront des moyens de la contourner. Cette tension conduit directement au principe suivant : aucune méthode, aussi efficace soit-elle, ne suffit à elle seule.

Invariant n° 2 : Fusion de signaux Fusion n'importe quel moteur utilisé seul

Aucun moteur de détection ne parvient à lui seul à obtenir des résultats optimaux. Il ne s'agit pas d'une limite inhérente à une technologie particulière, mais d'une propriété statistique liée à la combinaison de classificateurs indépendants. Lorsque plusieurs moteurs évaluent le même fichier à l'aide de méthodes différentes, leurs taux d'erreur ne s'additionnent pas de manière linéaire. Ils se compensent mutuellement, ce qui donne lieu à une capacité de détection combinée qui surpasse systématiquement celle de n'importe quel moteur pris isolément, quel que soit son niveau de sophistication.

La conclusion est simple, même si elle n'est pas très réjouissante. Un logiciel malveillant furtif n'a pas besoin de contourner tous les contrôles possibles. Il lui suffit de contourner celui sur lequel vous comptez le plus. Un fichier qui échappe aux contrôles de réputation mais déclenche des indicateurs comportementaux, ou qui échappe à la détection par signature mais présente des similitudes anormales avec une famille de logiciels malveillants connue, est intercepté dans un pipeline à plusieurs niveaux. Dans un modèle à moteur unique, il passe à l'étape suivante.

Les menaces liées aux fichiers restent le principal vecteur d'attaque

Pourquoi la détection des moteurs isolés ne fonctionne pas dans la pratique

La plupart des environnements utilisent déjà plusieurs outils, mais les signaux qu’ils génèrent sont souvent disparates. Un système signale un fichier comme suspect, un autre le juge inoffensif, tandis qu’un troisième génère des indicateurs qui nécessitent une interprétation manuelle. C’est donc à l’analyste qu’incombe la charge de la corrélation.

Cela entraîne deux types de défaillance récurrents :

  1. Une tentative de contournement réussit discrètement lorsqu'une menace échappe au contrôle initial et ne déclenche jamais d'inspection plus approfondie
  1. Le volume des alertes augmente lorsque des signaux qui se chevauchent ou qui s'opposent génèrent du bruit sans permettre de distinguer clairement les informations

À grande échelle, aucune de ces deux situations n'est viable. Dans les environnements à haut débit, soit la détection passe à côté de ce qui compte, soit elle submerge l'équipe chargée d'intervenir.

MetaDefender transforme quatre signaux en un seul verdict fiable

MetaDefender résout ce problème en organisant la détection sous la forme d'un pipeline unifié plutôt que d'un ensemble de contrôles indépendants. Chaque couche analyse le même fichier sous un angle différent, et les résultats sont regroupés en un verdict unique et corrélé.

Pipeline de détection MetaDefender et contribution des signaux

Couche

En quoi cela contribue-t-il ?

Réputation

Bloque rapidement les indicateurs connus, tels que les hachages, les domaines et les adresses IP malveillants

Analyse dynamique

Exécute des échantillons inconnus afin de mettre en évidence des comportements cachés et d'extraire des indicateurs de compromission (IOC)

Évaluation du niveau de menace

Corrèle les signaux pour obtenir un score de risque basé sur le niveau de confiance

Recherche de menaces

Identifie les liens entre les échantillons, en associant l'activité aux campagnes et aux familles

Chaque couche répond à une question différente. La réputation porte sur ce qui est déjà connu. L'analyse dynamique met en évidence ce qui ne l'est pas. La notation fournit un contexte, et la recherche de menaces relie des événements isolés pour en faire un ensemble exploitable. Le résultat final est une décision unique fondée sur l'ensemble des preuves disponibles, et non quatre résultats distincts. Sur l'ensemble des quatre couches, le pipeline atteint une efficacité de détection des vulnérabilités « zero-day » de 99,9 %.

Le pipeline unifié de détection des vulnérabilités « zero-day »

Une institution financière internationale a éliminé les goulots d'étranglement liés au SOC

Une institution financière internationale traitant près de 1 000 e-mails suspects par jour a mis en place une analyse dynamique au sein de son centre d'opérations de sécurité (SOC) grâce à un bac à sable basé sur une machine virtuelle et intégré à un système d'automatisation SOAR. Le système a bien fonctionné jusqu'à ce que le volume augmente. Sandbox se sont allongées, les incidents hautement prioritaires ont nécessité une intervention manuelle, et l'automatisation est devenue un goulot d'étranglement plutôt qu'un levier d'efficacité.

En déployant MetaDefender au niveau du périmètre, l'entreprise a déplacé la fusion des signaux en amont. Les fichiers ont ainsi été analysés avant leur transmission, et non plus après leur exécution sur les terminaux. Les goulots d'étranglement au niveau des files d'attente ont été éliminés, le temps d'analyse est passé de quelques minutes à quelques secondes, et le SOC a retrouvé la capacité de se concentrer sur les enquêtes plutôt que sur la gestion du retard accumulé.

Les lacunes en matière de détection dans les centres d'opérations de sécurité (SOC) traditionnels basés sur des bacs à sable

L'IA prédictive d'Alin résout le compromis entre vitesse et profondeur

Un pipeline multicouche améliore la précision. Mais à lui seul, il ne réduit pas le temps nécessaire pour parvenir à un verdict. Lorsque les volumes sont importants, le fait de soumettre chaque fichier à une analyse approfondie entraîne un temps de latence, et ce délai peut être exploité à d'autres étapes de la chaîne d'attaque.

Predictive Alin AI intervient en amont du pipeline en tant que couche d'intelligence pré-exécution, ce qui signifie que les verdicts sont rendus avant l'exécution d'un fichier, sans déclenchement dans un environnement sandbox. Entraînée sur des ensembles de données de niveau entreprise respectant la confidentialité et réentraînée en continu sur des vulnérabilités « zero-day » confirmées en sandbox,

La solution prédictive Alin AI émet des verdicts basés sur l'apprentissage automatique en quelques millisecondes, sans nécessiter d'exécution. Les fichiers identifiés comme malveillants sont immédiatement bloqués, tandis que les autres sont soumis à une analyse plus approfondie. Les verdicts sont rendus avec un P99 inférieur à 100 ms et un taux de faux positifs aussi bas que 0,1 %, ce qui signifie que les environnements à fort volume bénéficient de décisions rapides et précises sans submerger les analystes de données superflues.

Il ne s'agit pas d'un remplacement, mais d'une coordination. La prédiction à grande vitesse traite le volume au niveau périphérique, tandis que l'analyse par couches apporte la profondeur nécessaire là où elle est requise. Au fil du temps, la boucle de rétroaction entre les deux renforce chacune d'elles, améliorant ainsi la détection précoce sans augmenter le bruit.

En conclusion, ce sont les signaux coordonnés, et non pas un plus grand nombre de moteurs, qui permettent de résoudre le problème. La détection s'améliore lorsque ces signaux sont combinés, mis en corrélation et exploités de manière intégrée. Cela nous amène à l'invariance finale : les systèmes de détection qui se contentent de consommer des informations finissent par être dépassés par ceux qui les génèrent.

Principe n° 3 : les systèmes de détection doivent générer des informations, et non se contenter de les consommer

Il existe une différence notable entre un système de détection qui exploite des flux de menaces externes et un système qui génère ses propres renseignements. La détection basée sur des flux est limitée par nature : elle ne peut identifier que ce que d'autres ont déjà découvert, documenté et partagé. Les nouvelles menaces, les variantes modifiées et les attaques ciblées conçues pour échapper aux infrastructures de détection publiques échappent à ce cadre.

L'analyse dynamique change la donne. Lorsqu'un fichier est exécuté dans le cadre d'une inspection par émulation, le résultat ne se résume pas à un simple verdict. Il fournit des indicateurs de comportement, des données sur l'activité réseau, des informations de configuration et des traces d'exécution. Ces données constituent des renseignements de première main qui permettent la recherche rétrospective, le regroupement des variantes et le blocage proactif, fondés sur des comportements observés plutôt que sur des indicateurs signalés.

Pourquoi les secteurs réglementés ont besoin de preuves, et pas seulement de verdicts

Dans les secteurs des infrastructures critiques, des services financiers et de la défense, la vérifiabilité n'est pas seulement une question de choix architectural. Il s'agit d'une exigence opérationnelle liée à la conformité et à la traçabilité.

Les cadres réglementaires exigent de plus en plus une analyse vérifiable des menaces inconnues, et non plus une simple validation basée sur des données d'entrée. Un verdict binaire dépourvu de preuves à l'appui ne résiste pas à un audit ou à une enquête. Les systèmes de détection doivent être capables de démontrer comment un fichier s'est comporté, quels indicateurs ont été extraits et comment la décision a été prise.

Cela modifie également la manière dont les organisations appréhendent leurs propres risques. Un environnement capable de générer ses propres données de renseignement permet de dresser une image précise de l'activité des menaces au fil du temps. Des tendances se dégagent au niveau des campagnes, de la réutilisation des infrastructures et des schémas comportementaux récurrents ciblant des flux de travail spécifiques. Les flux externes, ainsi que les données de renseignement générées en interne, apportent une vision plus approfondie.

Comment MetaDefender et Predictive Alin AI bouclent la boucle

MetaDefender génère des informations de renseignement dans le cadre de son processus de détection. Chaque fichier analysé via une analyse dynamique par émulation produit des indicateurs comportementaux, des artefacts extraits et des signaux corrélés qui sont réinjectés dans le système. La détection devient ainsi un processus d'apprentissage continu plutôt qu'une décision ponctuelle.

Ces informations ne restent pas isolées. Elles alimentent l'IA prédictive d'Alin, où les vulnérabilités « zero-day » confirmées en environnement sandbox sont utilisées pour réentraîner les modèles de détection pré-exécution. Chaque menace confirmée renforce la capacité du système à reconnaître plus tôt des schémas similaires, avant même que l'exécution n'ait lieu. Cela crée une boucle de rétroaction entre l'analyse approfondie et la prédiction rapide.

Une agence gouvernementale nationale chargée de protéger les systèmes sensibles et les données des citoyens illustre bien cette différence opérationnelle. Son ancien bac à sable produisait des rapports détaillés, mais obligeait les analystes à interpréter manuellement des signaux comportementaux fragmentés, et la confiance dans la détection des vulnérabilités « zero-day » s'est érodée à mesure que des échantillons échappant aux filtres passaient entre les mailles du filet.

Après le déploiement MetaDefender , le sandboxing est passé d'un simple outil de génération de rapports à un pipeline de détection unifié, capable de fournir un verdict unique par fichier, étayé par des preuves comportementales structurées et une notation des menaces. C'était enfin le type de renseignements sur lesquels l'agence pouvait agir directement.

Le nouveau modèle de sécurité

Ce que le circuit de renseignements apporte aux équipes SOC

Pour les équipes SOC, cette évolution est tangible. Les analystes reçoivent des verdicts pré-corrélés, étayés par des preuves comportementales, au lieu de signaux isolés nécessitant une interprétation manuelle. Le nombre de faux positifs diminue et le temps consacré aux enquêtes est réduit, car chaque détection s'accompagne d'un contexte.

À grande échelle, cette distinction a son importance. Les systèmes de détection qui se contentent d'exploiter des données ont tendance à générer davantage de travail à mesure que le volume augmente. Les systèmes qui produisent eux-mêmes des données allègent cette charge en améliorant à la fois la précision et la mise en contexte au fil du temps.

L'objectif est de fonder la détection sur des éléments que les attaquants ne peuvent pas modifier. La production de renseignements fait partie de ces éléments, et les systèmes qui en font une fonction centrale acquièrent un avantage qui se renforce à chaque nouvelle menace.

Concevez des systèmes de détection en vous appuyant sur ce que les pirates ne peuvent pas modifier

Ces trois invariants constituent des contraintes, tant pour les attaquants que pour les systèmes conçus pour les contrer. Les adversaires ne cesseront de s'adapter, les systèmes de détection à composante unique continueront de passer à côté de ce que les systèmes à plusieurs niveaux parviennent à détecter, et les systèmes qui génèrent des renseignements continueront de devancer ceux qui se contentent de les exploiter.

Ces invariants sont utiles car ils décrivent ce que les attaquants ne peuvent pas modifier. Cela a des implications directes sur la manière dont les systèmes de détection sont conçus. Les défenses statiques perdent de leur efficacité avec le temps. La fusion de signaux s'avère systématiquement plus performante que les méthodes isolées. Chaque vulnérabilité « zero-day » confirmée permet soit d'améliorer votre prochain système de détection, soit constitue une occasion manquée que quelqu'un d'autre finira par exploiter.

MetaDefender et Predictive Alin AI ont été conçus pour répondre à ces contraintes. L'analyse dynamique par émulation met en évidence le comportement réel, le pipeline multicouche établit des corrélations entre les signaux pour aboutir à un verdict unique, et la boucle d'intelligence garantit que le système s'améliore à chaque fichier analysé.

Pour les organisations opérant dans des environnements à haut risque, les résultats sont concrets. La détection gagne en rapidité, en précision et en fiabilité. Les analystes consacrent moins de temps à recouper les signaux et davantage à y donner suite.

Si vous souhaitez découvrir l'ensemble des invariants de détection et l'architecture qui les sous-tend, consultez notre livre blanc intitulé « Les invariants de la cybersécurité » : opswat

Restez à jour avec OPSWAT!

Inscrivez-vous dès aujourd'hui pour recevoir les dernières mises à jour de l'entreprise, de l'entreprise, des histoires, des informations sur les événements, et plus encore.