Clustering
Aussi appelé : regroupement · partitionnement de données · analyse de clusters · segmentation automatique
Mis à jour le
Le clustering (regroupement) est une technique d'apprentissage non supervisé qui organise des données en groupes homogènes en fonction de leurs similarités naturelles, sans catégories définies à l'avance.
📖 Définition
💬 En termes simples
Imaginez un organisateur d'événements professionnels à Québec qui accueille 500 participants sans connaître leurs intérêts. En observant qui discute avec qui durant la pause-café, il remarque que des groupes se forment spontanément. Le clustering fait ce travail d'observation et de regroupement naturel, mais à partir de données numériques.
🎯 Exemple concret
Une société de transport en commun québécoise regroupe les trajets en profils de déplacement distincts et adapte ses horaires. Un détaillant de Sherbrooke découvre des segments de clientèle insoupçonnés. Un centre de recherche en santé publique de Montréal regroupe des données épidémiologiques par zones géographiques similaires.
💡 Le saviez-vous ?
L'algorithme K-means, inventé en 1957, reste l'un des plus utilisés aujourd'hui. Le clustering est utilisé en astronomie pour regrouper automatiquement des milliards d'étoiles en familles stellaires.
❓ Questions fréquentes
Quelle est la différence entre le clustering et la classification ?
Comment le clustering peut-il aider votre marketing ?
Quels sont les défis pour interpréter les résultats ?
📚 Sources
- Google - Clustering Algorithms (Google, 2024)
- Wikipedia - Cluster analysis (Wikipedia, 2024)
🔗 Termes liés
🏷️ Catégorie parente