Augmentation de données
Aussi appelé : Data Augmentation · data-augmentation · enrichissement de données · data enhancement
Mis à jour le
L'augmentation de données est une technique visant à enrichir artificiellement un jeu de données d'entraînement en créant des variations modifiées des exemples existants pour améliorer la robustesse du modèle.
📖 Définition
💬 En termes simples
C'est comme un professeur de conduite au Québec qui prépare ses élèves à l'examen de la SAAQ en les faisant pratiquer dans toutes les conditions possibles : pluie verglaçante, neige, routes de gravier, circulation dense à Montréal et routes rurales. En multipliant les scénarios, il s'assure que ses élèves seront prêts.
🎯 Exemple concret
Une entreprise d'inspection de ponts québécoise multiplie ses images de fissures sous différents angles et éclairages. Un studio de jeux vidéo montréalais augmente ses enregistrements vocaux pour entraîner un modèle capable de comprendre différents accents du français québécois. Une clinique vétérinaire enrichit ses radiographies animales pour des pathologies rares.
💡 Le saviez-vous ?
L'augmentation peut multiplier la taille d'un jeu de données par un facteur de 10 à 100. Certaines techniques avancées utilisent elles-mêmes des modèles d'IA générative pour créer des données synthétiques réalistes, créant un cercle vertueux.
❓ Questions fréquentes
Pourquoi créer des variations de données existantes ?
Comment cela fonctionne-t-il pour le texte ?
Quelles sont les limites de l'augmentation automatique ?
📚 Sources
- TensorFlow - Data Augmentation Guide (Google, 2024)
- Wikipedia - Data augmentation (Wikipedia, 2024)
🔗 Termes liés
🏷️ Catégorie parente