Veille IA Veille IA sans buzz : pour stratèges québécois.
La veille

Laboratoire METR

Laboratoire METR

Laboratoire METR

Aussi appelé : METR · Labo METR · METR Labs · Model Evaluation and Threat Research · Model Evaluation & Threat Research · évaluations METR · évaluation METR

Terme Avancé

Mis à jour le

Le laboratoire METR est une organisation indépendante dédiée à l'évaluation rigoureuse des capacités et des risques de sécurité des modèles d'intelligence artificielle les plus puissants.

📖 Définition

Le laboratoire METR (Model Evaluation & Threat Research) est un organisme indépendant à but non lucratif fondé par Beth Barnes, ancienne d'OpenAI et d'ARC Evals. Sa mission consiste à évaluer de façon rigoureuse les capacités potentiellement dangereuses des modèles d'intelligence artificielle de pointe, dits « frontier models », notamment ceux d'Anthropic (Claude), OpenAI (GPT), Google DeepMind (Gemini) et Meta (Llama). Pour ce faire, METR conçoit des batteries de tests appelées « Task Suites », composées de tâches autonomes complexes exigeant recherche, raisonnement et prise de décision agentique. L'organisation collabore étroitement avec les instituts nationaux de sécurité en IA, notamment ceux du Royaume-Uni (UK AISI) et des États-Unis (US AISI). D'ici 2026, ses évaluations devraient constituer une référence indépendante obligatoire avant le déploiement de tout nouveau modèle majeur, jouant ainsi un rôle clé dans la gouvernance mondiale de l'IA.

💬 En termes simples

C'est comme l'Office québécois de la langue française, mais pour vérifier si une IA risque de devenir trop forte… ou trop dangereuse.

🎯 Exemple concret

En 2026, avant le lancement de GPT-6, OpenAI a dû soumettre son modèle aux évaluations autonomes de METR pour obtenir le feu vert des régulateurs.

💡 Le saviez-vous ?

Saviez-vous que certaines tâches de METR simulent des scénarios où l'IA doit contourner des restrictions de sécurité, le tout sans intervention humaine ?

❓ Questions fréquentes

Quel est l'objectif principal des tests du METR ?
Le METR cherche à identifier si un modèle possède des capacités dangereuses, comme la création d'armes biologiques ou la cyber-offensive autonome. En testant les modèles avant leur sortie, ils agissent comme une sentinelle pour s'assurer que les innovations ne dépassent pas nos capacités de contrôle humain.
Comment le METR influence-t-il les entreprises comme OpenAI ?
Les grands laboratoires soumettent désormais volontairement leurs modèles au METR pour obtenir une certification de sécurité. Pour vous, consommateur d'IA, c'est une garantie supplémentaire que les outils que vous utilisez ont été audités par des experts neutres et compétents sur les risques extrêmes.
Quelles sont les méthodes d'évaluation utilisées par le lab ?
Ils utilisent des scénarios complexes où le modèle doit résoudre des problèmes de programmation ou de planification sans aide. Si le modèle réussit trop facilement des tâches critiques, le METR alerte sur la nécessité de renforcer les garde-fous avant tout déploiement public.

📚 Sources

🔐 Connexion rapide

Entrez votre courriel pour recevoir un code à 6 chiffres.

Pas besoin de mot de passe ni d'inscription. Entrez votre courriel, recevez un code par courriel, et c'est tout !