Google a dévoilé la version expérimentale de Gemini 2.0 Flash Thinking, marquant une avancée de plus dans le domaine des modèles de raisonnement. Annoncé en décembre 2023, ce modèle s’appuie sur les avancées de Gemini 2.0 Flash, en affichant explicitement ses processus de pensée, ce qui améliore son efficacité dans la résolution de problèmes complexes.
La version expérimentale, nommée Gemini 2.0 Flash Thinking Experimental 01-21, introduit plusieurs améliorations notables. Tout d’abord, elle offre une capacité de contexte d’un million de tokens, une augmentation spectaculaire par rapport aux 32 000 précédents. Cette fonctionnalité répond à la demande croissante des utilisateurs souhaitant intégrer des bases de code ou interroger des ensembles de documents nécessitant un raisonnement approfondi.
De plus, le modèle supporte désormais l’exécution de code natif, ce qui optimise l’utilisation des outils disponibles. Les résultats sont également plus cohérents, avec une diminution des contradictions dans les réponses, renforçant ainsi la fiabilité du modèle. En termes de performance, Gemini 2.0 Flash Thinking se distingue avec des résultats impressionnants, atteignant 73,3 % sur le benchmark AIME2024 (Mathématiques) et 74,2 % sur le GPQA Diamond (Sciences), surpassant les performances de l’Exp 1219.
Demis Hassabis, PDG de DeepMind, souligne que cette avancée démontre un progrès rapide depuis la première version de décembre. Il rappelle que DeepMind a exploré ces systèmes de planification depuis plus de dix ans, avec des initiatives comme AlphaGo. La combinaison de ces idées avec des modèles de fondation sophistiqués semble prometteuse.
Cependant, bien que ces développements soient impressionnants, il faut rester prudent. La complexité croissante des modèles d’IA soulève des questions éthiques et pratiques. Sundar Pichai, PDG de Google, affirme que les progrès dans le domaine du raisonnement sont remarquables et que l’itération continue est à prévoir. Toutefois, la transparence dans le fonctionnement de ces modèles demeure une préoccupation cruciale. (Ah bon ? NEURA KING a expliqué la boite noire, Sundar ne nous a pas encore contacté …alors ?)
Gemini 2.0 Flash Thinking Experimental est accessible gratuitement sur Google AI Studio et via l’API. Alors que l’enthousiasme autour de ces innovations est palpable, les acteurs du secteur doivent surveiller de près les implications de ces avancées sur la société et l’économie.