Modèle de diffusion

Aussi appelé : Diffusion Model · modèles de diffusion · diffusion-models · diffusion architecture

Terme IA Avancé 🧠 Concepts fondamentaux

Mis à jour le 28 mai 2026

Un modèle de diffusion est une architecture d'IA générative qui crée des images ou des sons en apprenant à retirer progressivement le bruit numérique d'un signal pour révéler une structure cohérente.

📖 Définition

Un modèle de diffusion est une architecture d'IA générative qui apprend à créer des données en inversant un processus graduel de destruction par le bruit. Durant l'entraînement, le modèle observe comment du bruit est progressivement ajouté à des données réelles, puis il apprend à inverser ce processus. Lors de la génération, il part de bruit pur et le transforme progressivement en une image, un son ou une vidéo cohérente. Cette approche surpasse les GAN dans de nombreuses applications.

💬 En termes simples

Imaginez une sculpture de glace au Carnaval de Québec qui fond lentement jusqu'à devenir une flaque d'eau. Un modèle de diffusion, c'est comme un artiste qui aurait étudié chaque étape de cette fonte et qui serait capable, à partir d'une flaque quelconque, de reconstituer une magnifique sculpture en inversant le processus.

🎯 Exemple concret

Midjourney, DALL-E et Stable Diffusion, tous basés sur des modèles de diffusion, permettent aux agences québécoises de produire des visuels publicitaires photoréalistes en quelques secondes. Des architectes montréalais génèrent des propositions visuelles de bâtiments. Des chercheurs à l'Université de Sherbrooke explorent ces modèles pour le développement de médicaments.

💡 Le saviez-vous ?

Les modèles de diffusion se sont imposés en seulement deux ans (2022-2024), détrônant les GAN qui régnaient depuis une décennie. Leur principe mathématique s'inspire de la thermodynamique et du mouvement brownien, établissant un pont entre la physique fondamentale et l'IA générative.

❓ Questions fréquentes

Comment une IA peut-elle créer une image à partir de « bruit » ?

Imaginez une photo que l'on brouille jusqu'à ce qu'elle devienne un nuage de pixels gris. Le modèle de diffusion apprend à faire le chemin inverse : il part d'un nuage de pixels et, guidé par votre texte (prompt), il enlève le « grain » petit à petit pour faire apparaître un chat, un paysage ou n'importe quel objet demandé.

Quelle est la différence entre un modèle de diffusion et un GAN ?

Les GAN sont rapides mais instables et produisent parfois des images déformées. Les modèles de diffusion (utilisés par Midjourney ou DALL-E) sont plus lents car ils procèdent par étapes, mais ils offrent une diversité et une qualité de détails bien supérieures, ce qui les a rendus dominants dans la création artistique par IA.

Quelles sont les limitations de ces modèles ?

Ils demandent beaucoup de puissance de calcul et de temps pour générer une seule image haute résolution. De plus, ils ont parfois du mal avec les détails très précis comme le texte écrit ou le nombre exact de doigts sur une main humaine, bien que les versions récentes s'améliorent rapidement.

📚 Sources

ArXiv - Denoising Diffusion Probabilistic Models (Jonathan Ho et al., 2020)
Wikipedia - Diffusion model (Wikipedia, 2024)

🔗 Termes liés

🏷️ Catégorie parente

Apprentissage profond

🌿 Sous-termes

Stable Diffusion Sora DALL-E

Accueil

Outils

Annuaire

Apprendre