RAG
Aussi appelé : Retrieval-Augmented Generation · RAGs · génération augmentée par récupération · système RAG
Mis à jour le
Le RAG est une architecture qui combine la génération de texte par IA avec un système de recherche documentaire pour fournir des réponses basées sur des sources externes fiables et actualisées.
📖 Définition
💬 En termes simples
C'est autoriser l'IA à faire un examen à « livre ouvert » plutôt que de se fier uniquement à sa mémoire.
🎯 Exemple concret
Un chatbot d'entreprise qui va lire le manuel PDF de l'employé avant de répondre à une question sur les vacances.
💡 Le saviez-vous ?
Cette technique réduit considérablement les hallucinations en forçant l'IA à se baser sur des sources réelles.
Bien que performant, le RAG classique peut encore halluciner en mélangeant ses connaissances internes au contexte fourni. Pour les secteurs à risque tels que le médical ou la conformité à la « Loi 25 » au Québec, vous devriez privilégier le RAG strict. Cette approche renforce la traçabilité en refusant systématiquement de répondre si l'information est absente de vos sources documentaires.
❓ Questions fréquentes
En quoi le RAG diffère-t-il du fine-tuning ?
Quand devriez-vous privilégier l'utilisation du RAG ?
Quels sont les principaux défis de mise en œuvre du RAG ?
📚 Sources
- Meta AI - Retrieval-Augmented Generation (Patrick Lewis et al., 2020)
- AWS - What is RAG? (Amazon, 2024)
🔗 Termes liés
🌿 Sous-termes