Aussi appelé :
METR · Labo METR · METR Labs · Model Evaluation and Threat Research · Model Evaluation & Threat Research · évaluations METR · évaluation METR
TermeAvancé
Mis à jour le
Le laboratoire METR est une organisation indépendante dédiée à l'évaluation rigoureuse des capacités et des risques de sécurité des modèles d'intelligence artificielle les plus puissants.
📖 Définition
Le laboratoire METR (Model Evaluation & Threat Research) est un organisme indépendant à but non lucratif fondé par Beth Barnes, ancienne d'OpenAI et d'ARC Evals. Sa mission consiste à évaluer de façon rigoureuse les capacités potentiellement dangereuses des modèles d'intelligence artificielle de pointe, dits « frontier models », notamment ceux d'Anthropic (Claude), OpenAI (GPT), Google DeepMind (Gemini) et Meta (Llama). Pour ce faire, METR conçoit des batteries de tests appelées « Task Suites », composées de tâches autonomes complexes exigeant recherche, raisonnement et prise de décision agentique. L'organisation collabore étroitement avec les instituts nationaux de sécurité en IA, notamment ceux du Royaume-Uni (UK AISI) et des États-Unis (US AISI). D'ici 2026, ses évaluations devraient constituer une référence indépendante obligatoire avant le déploiement de tout nouveau modèle majeur, jouant ainsi un rôle clé dans la gouvernance mondiale de l'IA.
💬 En termes simples
C'est comme l'Office québécois de la langue française, mais pour vérifier si une IA risque de devenir trop forte… ou trop dangereuse.
🎯 Exemple concret
En 2026, avant le lancement de GPT-6, OpenAI a dû soumettre son modèle aux évaluations autonomes de METR pour obtenir le feu vert des régulateurs.
💡 Le saviez-vous ?
Saviez-vous que certaines tâches de METR simulent des scénarios où l'IA doit contourner des restrictions de sécurité, le tout sans intervention humaine ?
❓ Questions fréquentes
Quel est l'objectif principal des tests du METR ?
Le METR cherche à identifier si un modèle possède des capacités dangereuses, comme la création d'armes biologiques ou la cyber-offensive autonome. En testant les modèles avant leur sortie, ils agissent comme une sentinelle pour s'assurer que les innovations ne dépassent pas nos capacités de contrôle humain.
Comment le METR influence-t-il les entreprises comme OpenAI ?
Les grands laboratoires soumettent désormais volontairement leurs modèles au METR pour obtenir une certification de sécurité. Pour vous, consommateur d'IA, c'est une garantie supplémentaire que les outils que vous utilisez ont été audités par des experts neutres et compétents sur les risques extrêmes.
Quelles sont les méthodes d'évaluation utilisées par le lab ?
Ils utilisent des scénarios complexes où le modèle doit résoudre des problèmes de programmation ou de planification sans aide. Si le modèle réussit trop facilement des tâches critiques, le METR alerte sur la nécessité de renforcer les garde-fous avant tout déploiement public.
Reçois chaque semaine le meilleur de l'actualité IA, directement dans ta boîte.
Pas de pourriel, désinscription en 1 clic.
✉️
Restez informé
Recevez nos sélections d'outils et articles directement dans votre boîte courriel.
🔐 Connexion rapide
Entrez votre courriel pour recevoir un code à 6 chiffres.
Pas besoin de mot de passe ni d'inscription. Entrez votre courriel, recevez un code par courriel, et c'est tout !
✓
Paramètres de confidentialité
Nous utilisons des témoins (cookies) pour assurer le bon fonctionnement du site, analyser le trafic et personnaliser le contenu. Vous pouvez gérer vos préférences ci-dessous.
Politique de confidentialité