SVG dévoilé : Comprendre les vulnérabilités XXE et défendre votre base de code

Jun 25, 2024 par Luan Pham, testeur de pénétration associé

Partager cet article

Les fichiers images sont généralement considérés comme des fichiers sûrs et sont souvent manipulés sans conscience des problèmes de sécurité potentiels. Ces fichiers images, en particulier les fichiers SVG, sont des vecteurs d'attaque courants pour lancer des attaques dangereuses telles que les scripts intersites (XSS) ou l'injection d'entités externes XML (XXE). Contrairement aux attaques XSS, les attaques par injection XXE n'affectent pas le côté client, mais elles peuvent affecter de manière significative le côté serveur, entraînant plusieurs impacts graves. Dans ce billet de blog, nous allons explorer la nature des attaques XXE, en particulier via le vecteur d'attaque SVG (Scalable Vector Graphics ), discuter d'un exemple réel et fournir des stratégies d'atténuation avec les produits OPSWAT .

Informations générales

Avant de nous pencher sur la vulnérabilité, nous allons d'abord examiner le format de fichier XML et SVG et la cause profonde de la technique d'injection XXE.

Format de fichier XML

XML (eXtensible Markup Language) est un format de fichier indépendant de la plate-forme pour le stockage et l'échange de données structurées. Le XML prend en charge la structure hiérarchique, ce qui le rend idéal pour représenter des relations de données complexes. Les données au format XML sont organisées en balises, attributs et contenu, de la même manière que le HTML. Cependant, XML est hautement personnalisable et extensible, ce qui permet aux utilisateurs de définir leurs balises et leurs attributs en fonction de leurs besoins. La figure ci-dessous montre les données du département IT au format XML.

Extrait de code XML affichant les détails d'un employé dans une structure de département IT

Entités XML

En XML, les entités sont des espaces réservés pour les données qui vous permettent d'incorporer du texte ou des documents entiers dans le document actuel. D'un point de vue syntaxique, une entité en XML est entourée d'une esperluette (&) et d'un point-virgule ( ;). Dans l'exemple ci-dessous, deux entités sont définies dans la définition du type de document et font référence au contenu du fichier XML. La différence entre les deux entités est que l'entité interne est définie et référencée dans le document actuel, tandis que le contenu de l'entité externe provient d'un document externe. Après l'analyse et la résolution des entités, celles-ci sont remplacées par les données correspondantes.

Exemple de code d'un document XML avec des entités internes et externes comprenant un message d'accueil

Exemple de code XML simplifié mettant en évidence la structure et l'utilisation des entités et du contenu

Format de fichier SVG

SVG (Scalable Vector Graphics) est un format de fichier polyvalent très utilisé dans le développement web, la conception graphique et la visualisation de données. Contrairement aux formats d'image traditionnels tels que JPEG ou PNG, SVG utilise le format XML pour décrire des graphiques vectoriels bidimensionnels. Plus précisément, les images SVG sont composées de formes géométriques telles que des lignes, des courbes et des polygones, définies par des équations mathématiques plutôt que par des pixels individuels. Par conséquent, les graphiques SVG peuvent être mis à l'échelle à l'infini sans perte de qualité, ce qui les rend idéaux pour la conception de sites web réactifs et les écrans à haute résolution. En raison de la nature XML du format SVG, il fournit également des vecteurs d'attaque potentiels pour les exploits liés à XML.

Exemple d'image montrant la structure d'un fichier SVG de base avec un contenu textuel

Technique d'injection XXE et impacts

La technique d'injection XXE abuse du mécanisme de résolution des entités externes. Plus précisément, lorsque l'analyseur syntaxique rencontre une entité externe, il récupère le contenu correspondant en fonction du type du fichier ressource.

Si le fichier de ressources est local, l'analyseur syntaxique récupère le contenu du fichier et remplace l'entité par les données correspondantes. Cela permettrait à un attaquant de montrer des données sensibles telles que la configuration du serveur, les informations d'identification, etc. Pour exploiter avec succès la vulnérabilité, l'attaquant déclare une entité externe faisant référence au contenu de fichiers sensibles, /etc./password par exemple.

Toutefois, si la ressource est distante ou s'il s'agit d'un service interne, l'analyseur syntaxique essaiera de récupérer les données en demandant l'URL définie. Cela pourrait être exploité pour effectuer une falsification de requête côté serveur (SSRF). Dans ce cas, au lieu de faire référence à un fichier local, l'attaquant modifiera la charge utile en URL du service vulnérable à demander au nom du serveur.

Attaque XXE via une mauvaise manipulation des fichiers SVG : Une étude de cas

Nous allons étudier un XXE pour un cas réel, la bibliothèque SVGLIB jusqu'à la version 0.9.3. La vulnérabilité a été découverte en 2020 et assignée CVE-2020-10799. Nous allons d'abord examiner le flux de la bibliothèque, analyser l'extrait de code vulnérable, et enfin prouver l'exploitation via un service de conversion de SVG en PNG. La cible est constituée d'applications web auto-implémentées utilisant des versions vulnérables de SVGLIB pour la conversion.

Paquet svglib

svglib est une bibliothèque purement Python conçue pour convertir le format SVG en d'autres formats tels que PNG, JPG, PDF, etc. en utilisant la boîte à outils Open-Source Report Lab. Comme les fichiers SVG utilisent le format XML, l'analyse et la manipulation du XML font également partie du flux principal de la bibliothèque. Les trois étapes principales de la bibliothèque sont les suivantes :

Diagramme de processus illustrant les étapes allant de l'analyse d'un fichier SVG à sa conversion dans un autre format

Exploitation

La vulnérabilité réside dans le processus d'analyse du fichier SVG qui, s'il est mal configuré, entraîne une fuite des données sensibles sur le serveur et peut provoquer des vulnérabilités SSRF. Un examen plus approfondi du code source du paquetage svglib montre que la vulnérabilité XXE est due à l'utilisation de la configuration par défaut pour l'analyse et le traitement du format XML lors du chargement du fichier SVG. Le paquetage utilise le paquetage lxml, dans lequel la valeur par défaut des attributs resolve_ entities pour la classe XMLParser est True.

Différence de code montrant les changements dans une fonction Python pour charger un fichier SVG avec des options de résolution d'entités

Organigramme d'un processus d'attaque XXE utilisant des fichiers SVG dans un contexte de sécurité

Remédiation

La cause première du problème est l'analyse XML non sécurisée, qui est mise en œuvre de manière incorrecte dans la bibliothèque svglib et dans une partie de la dépendance lxml. Par conséquent, l'utilisation d'une version vulnérable de cette bibliothèque peut entraîner la divulgation d'informations sensibles, la falsification de requêtes côté serveur, voire l'exécution potentielle de codes à distance, en fonction de l'environnement déployé et de la fonctionnalité de l'application. Les vulnérabilités introduites par des bibliothèques tierces constituent un problème grave pour la sécurité des grandes applications, car leurs dépendances peuvent être complexes et non transparentes.

MetaDefender Software Supply Chain

OPSWAT MetaDefender Software Supply Chain offre une visibilité accrue et une défense solide contre les risques liés à la chaîne d'approvisionnement grâce à la combinaison de plusieurs technologies. OPSWAT Software Bill of Materials (SBOM) permet d'obtenir une visibilité sur les logiciels tiers open-source et d'identifier les dépendances logicielles, les vulnérabilités et autres risques potentiels existant sous chaque couche d'une image de conteneur. Grâce à l'intégration de plus de 30 moteurs antivirus combinés, le taux de détection des logiciels malveillants de la technologieMultiscanning atteint plus de 99,99 %. En outre, la technologieProactive DLP (Data Loss Prevention) identifie les informations d'identification telles que les mots de passe, les secrets, les jetons, les clés API ou d'autres informations sensibles laissées dans le code source. Grâce à nos technologies de détection et de prévention des menaces à confiance zéro, votre cycle de développement logiciel (SDLC) est protégé contre les logiciels malveillants et les vulnérabilités, ce qui renforce la sécurité des applications et le respect de la conformité.

Tableau de bord de laSupply Chain OPSWAT MetaDefender Software montrant les résultats de l'analyse du référentiel pour les vulnérabilités et les menaces

Rapport de sécurité OPSWAT MetaDefender Software Supply Chain pour un fichier requirements.txt n'indiquant aucune menace ou secret détecté

MDSSC détecte le CVE trouvé dans svglib. Il signale également le niveau de gravité du CVE dans le rapport SBOM et identifie la version du logiciel vulnérable.

MetaDefender Core - Deep CDR

Une autre raison qui rend l'exploit possible est que l'application traite un fichier SVG injecté avec une charge utile malveillante. Par conséquent, si le fichier image est assaini avant d'être introduit dans le service de conversion, la charge utile sera éliminée, ce qui empêchera l'attaque de se produire. La technologie Deep Content Disarm and Reconstruction (CDR) de MetaDefender Core protège contre les menaces connues et inconnues véhiculées par les fichiers en assainissant et en reconstruisant les fichiers. Grâce à la prise en charge de plus de 160 types de fichiers courants et à des centaines d'options de reconstruction de fichiers, OPSWAT's Deep CDR neutralise toute menace potentielle intégrée, garantissant que le fichier assaini reste pleinement utilisable avec un contenu sûr.

Code XML modifiable au format SVG avec la vulnérabilité XXE décrite dans l'élément DOCTYPE — Le fichier SVG malveillant

Version propre du code XML au format SVG sans vulnérabilité XXE — Le fichier SVG après avoir été assaini avec MetaDefender Core - Deep CDR

Rapport de sécurité montrant les fichiers SVG marqués comme autorisés et assainis après l'évaluation de la vulnérabilité — MetaDefender Core - Deep CDR résultat aseptisé

Bio de l'auteur

Luan Pham a participé au programme Critical Infrastructure Cybersecurity Graduate Fellowship de OPSWAT et il est actuellement testeur de pénétration associé à OPSWAT. Il est passionné par la protection des produits de OPSWAT contre les menaces potentielles et par le partage de ses connaissances.

Luan Pham

Testeur de pénétration associé

Tags :

Derniers messages

Sortie de MetaDefender v5.17.0
Déc 22, 2025
MetaDefender avec Smart Touch v1.4.0 Sortie
Déc 19, 2025
La mise à jour à ne pas manquer : fin du support pour Office 2016 et Office 2019
Déc 19, 2025
MetaDefender Salesforce lance Reputation Service renforcer la sécurité des fichiers
Déc 17, 2025
Solutions interdomaines : Plus qu'un simple flux à sens unique
Déc 17, 2025

S'inscrire à la lettre d'information OPSWAT

Obtenez les dernières mises à jour de la société OPSWAT ainsi que des informations sur les événements et les nouvelles qui font avancer l'industrie OPSWAT les nouvelles qui font avancer l'industrie.

Signez-moi

Suivez-nous sur les réseaux sociaux Media

Suivez OPSWAT sur LinkedIn, Facebook, Twitter et YouTube pour en savoir plus !

Restez à jour avec OPSWAT!

Inscrivez-vous dès aujourd'hui pour recevoir les dernières mises à jour de l'entreprise, de l'entreprise, des histoires, des informations sur les événements, et plus encore.