Attaque adversariale
Aussi appelé : Adversarial Attack · attaque adverse · adversarial-attack · adversarial attacks
Mis à jour le
Une attaque adversariale est une tentative délibérée de tromper un modèle d'IA en introduisant des perturbations subtiles et souvent invisibles dans les données d'entrée pour provoquer une erreur de prédiction.
📖 Définition
💬 En termes simples
Imaginez un faussaire qui modifie à peine un billet de banque canadien — un micro-détail invisible — mais qui suffit à tromper un guichet automatique. L'attaque adversariale fonctionne de la même manière : une modification infime qui induit le système d'IA en erreur.
🎯 Exemple concret
Une banque canadienne effectue des tests d'attaques adversariales sur son système de détection de fraude. Un constructeur automobile teste la robustesse de la conduite autonome face à des panneaux de signalisation modifiés. Un organisme gouvernemental audite la sécurité de son système de reconnaissance faciale.
💡 Le saviez-vous ?
Des chercheurs ont démontré qu'il est possible de tromper un système de reconnaissance d'images en modifiant un seul pixel. Le domaine a donné naissance à l'entraînement adversarial, où l'on expose volontairement un modèle à des exemples manipulés pour le rendre plus robuste.
❓ Questions fréquentes
Comment peut-on « piéger » une intelligence artificielle ?
Quels sont les risques pour la cybersécurité ?
Comment pouvez-vous protéger vos systèmes d'IA ?
📚 Sources
- OpenAI - Adversarial Attacks and Defenses (Ian Goodfellow et al., 2017)
- Wikipedia - Adversarial machine learning (Wikipedia, 2024)
🔗 Termes liés
🏷️ Catégorie parente