Google met discrètement à niveau Deep Think, ARC-AGI-2 atteint directement 84,6 %

2/14/2026
3 min read

Google met discrètement à niveau Deep Think, ARC-AGI-2 atteint directement 84,6 %

Google DeepMind vient de mettre à niveau le mode de raisonnement dédié de Gemini 3, Deep Think, et les scores ont directement explosé les classements.

Deep Think

Il faut savoir qu'ARC-AGI-2 est actuellement reconnu comme la référence de pointe pour tester les capacités de raisonnement de l'IA, et aucun modèle n'avait obtenu de très bons scores auparavant.

Comparaison des références

Et Deep Think mis à niveau a obtenu 84,6 %, en comparaison : Claude Opus 4.6 est à 68,8 %, GPT-5.2 est à 52,9 %, et même Gemini 3 Pro Preview n'est qu'à 31,1 %.

Amélioration énorme.

Pas seulement le raisonnement

Les ambitions de Deep Think ne se limitent évidemment pas au raisonnement.

Pas seulement le raisonnement

Sur la référence Humanity's Last Exam, surnommée « le dernier examen de l'humanité », Deep Think a obtenu 48,4 %. Ce test couvre les problèmes les plus difficiles en mathématiques, sciences et ingénierie. Claude Opus 4.6 a obtenu 40,0 % et GPT-5.2 34,5 %.

La programmation est également très performante :

Sur Codeforces, Deep Think a atteint Elo 3455, tandis que Gemini 3 Pro Preview est à 2512 et Claude Opus 4.6 à 2352.

Codeforces

De plus, sur la référence MMMU-Pro pour la compréhension et le raisonnement multimodaux, Deep Think est également en tête avec 81,5 %, mais ici, les écarts entre les différents modèles ne sont pas si importants : Gemini 3 Pro Preview 81,0 %, GPT-5.2 79,5 %, Claude Opus 4.6 73,9 %.

MMMU-Pro

En plus des scores, Deep Think a également obtenu un résultat de niveau médaille d'or dans la partie écrite des Olympiades de physique et de chimie de 2025.

Résoudre les problèmes scientifiques

Google DeepMind a particulièrement souligné cette fois que Deep Think mis à niveau n'est plus seulement une machine à résoudre des problèmes, mais doit résoudre des problèmes scientifiques et d'ingénierie du monde réel.

Problèmes scientifiques

Ils ont présenté le cas du Wang Lab de l'Université Duke : des chercheurs utilisent Deep Think pour concevoir de nouveaux matériaux semi-conducteurs et optimiser le processus de croissance de cristaux complexes, qui sont des matériaux candidats pour les semi-conducteurs à haute température.

Cas Duke

Ingénierie mécanique

Il y a aussi des chercheurs dans le domaine de l'ingénierie mécanique qui l'utilisent pour itérer des prototypes physiques, permettant à l'itération du matériel d'atteindre la vitesse de l'itération du logiciel, ce qui signifie des cycles d'amélioration plus rapides dans des domaines tels que les dispositifs d'assistance.

Comment utiliser

Le mode Deep Think mis à niveau a maintenant commencé à être déployé dans l'application Gemini pour les abonnés Google AI Ultra.

Comment utiliser

Pour les chercheurs et les développeurs, Google a ouvert un programme d'accès anticipé Vertex AI, qui peut être utilisé via l'API.

Accès anticipé Vertex AI : https://goo.gle/4rMHUlq

Published in Technology

You Might Also Like