Microsoft lance Harrier, un modèle d'embedding open-source
L'équipe de Bing chez Microsoft a lancé Harrier, un modèle d'embedding open-source supportant plus de 100 langues et offrant une fenêtre contextuelle de 32 000 tokens. Harrier surpasse les modèles propriétaires d'OpenAI et d'Amazon.
Que faut-il retenir ?
- Harrier supporte plus de 100 langues et une fenêtre contextuelle de 32 000 tokens.
- Le modèle a été entraîné sur plus de deux milliards d'exemples et des données synthétiques de GPT-5.
- Harrier occupe la première place sur le benchmark multilingue MTEB v2.
- Trois versions du modèle sont disponibles sur Hugging Face sous licence MIT.
Pourquoi cette nouvelle compte-t-elle ?
Harrier représente une avancée significative dans les modèles d'embedding, essentiels pour la recherche et l'organisation des informations dans les systèmes d'IA. Son intégration dans Bing et les services de base pour agents IA pourrait améliorer considérablement les performances et l'efficacité des tâches complexes.
Public concerné : développeurs, entreprises