Étiquetage de données
Aussi appelé : Data Labeling · data-labeling · annotation de données · data tagging
Mis à jour le
L'étiquetage de données (Data Labeling) est le processus manuel ou semi-automatique consistant à ajouter des métadonnées descriptives à des données brutes pour permettre à une IA d'apprendre par supervision.
📖 Définition
💬 En termes simples
C'est comme un archiviste de Bibliothèque et Archives nationales du Québec qui catalogue méticuleusement chaque document en lui attribuant un sujet, une date et une description. Sans ce travail rigoureux, il serait impossible de retrouver quoi que ce soit. Sans étiquetage, un modèle d'IA ne sait tout simplement pas ce qu'il regarde.
🎯 Exemple concret
Une firme de cartographie forestière au Québec emploie des biologistes pour étiqueter des images satellites par essences d'arbres. Une entreprise de véhicules autonomes de Laval annote piétons, cyclistes et obstacles sur des vidéos en toutes saisons. Un centre hospitalier de Trois-Rivières mobilise ses radiologues pour étiqueter des milliers de radiographies.
💡 Le saviez-vous ?
L'étiquetage représente jusqu'à 80 % du temps total d'un projet d'IA. L'industrie mondiale de l'étiquetage emploie des millions de travailleurs et devrait atteindre 17 milliards de dollars d'ici 2028.
❓ Questions fréquentes
Pourquoi l'étiquetage est-il considéré comme le « travail de l'ombre » de l'IA ?
Comment pouvez-vous garantir la qualité de l'étiquetage ?
Existe-t-il des méthodes pour automatiser ce travail ?
📚 Sources
- AWS - What is Data Labeling? (Amazon, 2024)
- Wikipedia - Data labeling (Wikipedia, 2024)
🔗 Termes liés
🏷️ Catégorie parente