Deepmind réinvente le curseur avec l'IA Gemini
Deepmind travaille sur un curseur IA transformant les pixels en entités structurées (lieux, dates, objets). Cette innovation, intégrée à Gemini dans Chrome, permettra des interactions simplifiées via des commandes vocales et gestuelles. Le 'Magic Pointer' sera bientôt lancé sur Googlebook.
« "Because a typical AI tool lives in its own window, users need to drag their world into it. We want the opposite," write Deepmind researchers Adrien Baranes and Rob Marchant. » — The Decoder
Que faut-il retenir ?
- Deepmind développe un curseur IA Gemini pour capturer le contexte visuel et sémantique autour du pointeur.
- Les utilisateurs pourront utiliser des commandes simplifiées comme 'Corrige ça' ou 'Déplace ici' combinées à la voix et aux gestes.
- Les pixels deviennent des 'entités structurées' comme des lieux, dates ou objets, transformant une note manuscrite en liste de tâches interactive.
- La fonctionnalité 'Magic Pointer' sera bientôt lancée sur Googlebook et est déjà intégrée à Gemini dans Chrome.
Pourquoi cette nouvelle compte-t-elle ?
Cette innovation réduit la complexité des interactions avec l'IA en permettant des commandes naturelles et contextuelles. Les professionnels gagneront en efficacité pour des tâches quotidiennes, sans avoir à maîtriser l'ingénierie des prompts. L'intégration dans Chrome et Googlebook en fera une fonctionnalité largement accessible.
null
💬 Adrien Baranes et Rob Marchant, Chercheurs chez Deepmind
Public concerné : développeurs, entreprises
Comment le curseur IA de Deepmind simplifie-t-il les interactions ?
Le curseur Gemini capture le contexte visuel et sémantique, permettant des commandes vocales et gestuelles naturelles comme 'Corrige ça'. Il transforme les pixels en entités structurées pour des interactions plus intuitives.