Hyperparamètre
Aussi appelé : Hyperparameter · hyperparamètres · hyper-parameter · hyper-parameters
Mis à jour le
Un hyperparamètre est un réglage de configuration défini manuellement avant l'entraînement d'un modèle d'IA pour contrôler son processus d'apprentissage et optimiser ses performances finales.
📖 Définition
💬 En termes simples
Pensez à la préparation d'une tourtière : avant de commencer la cuisson, vous devez décider de la température du four, du temps de cuisson et de l'épaisseur de la pâte. Ces choix ne changent pas pendant la cuisson, mais ils déterminent complètement la qualité du résultat final. Les hyperparamètres jouent exactement ce rôle.
🎯 Exemple concret
Des plateformes d'AutoML permettent aux entreprises québécoises d'optimiser automatiquement les hyperparamètres de leurs modèles. Un chercheur au Mila ajuste le taux d'apprentissage de son modèle de traduction : trop élevé, le modèle oscille; trop faible, l'entraînement prend des semaines. Des compétitions Kaggle sont souvent remportées grâce à un ajustement minutieux des hyperparamètres.
💡 Le saviez-vous ?
Tester une seule combinaison d'hyperparamètres pour un grand modèle peut nécessiter des jours de calcul sur des centaines de GPU, soit des dizaines de milliers de dollars par essai. Des techniques comme la recherche bayésienne permettent d'explorer l'espace des hyperparamètres de façon intelligente, réduisant le nombre d'essais de plusieurs ordres de grandeur.
❓ Questions fréquentes
Quelle est la différence entre un paramètre et un hyperparamètre ?
Comment choisit-on les bons hyperparamètres ?
Quels sont les risques d'un mauvais réglage ?
📚 Sources
- Google - Hyperparameter Tuning (Google, 2024)
- Wikipedia - Hyperparamètre (Wikipedia, 2024)