Google met discrètement à niveau Deep Think, ARC-AGI-2 atteint directement 84,6 %

Google DeepMind vient de mettre à niveau le mode de raisonnement dédié de Gemini 3, Deep Think, et les scores ont directement explosé les classements.

Deep Think

Il faut savoir qu'ARC-AGI-2 est actuellement reconnu comme la référence de pointe pour tester les capacités de raisonnement de l'IA, et aucun modèle n'avait obtenu de très bons scores auparavant.

Comparaison des références

Et Deep Think mis à niveau a obtenu 84,6 %, en comparaison : Claude Opus 4.6 est à 68,8 %, GPT-5.2 est à 52,9 %, et même Gemini 3 Pro Preview n'est qu'à 31,1 %.

Amélioration énorme.

Pas seulement le raisonnement

Les ambitions de Deep Think ne se limitent évidemment pas au raisonnement.

Pas seulement le raisonnement

Sur la référence Humanity's Last Exam, surnommée « le dernier examen de l'humanité », Deep Think a obtenu 48,4 %. Ce test couvre les problèmes les plus difficiles en mathématiques, sciences et ingénierie. Claude Opus 4.6 a obtenu 40,0 % et GPT-5.2 34,5 %.

La programmation est également très performante :

Sur Codeforces, Deep Think a atteint Elo 3455, tandis que Gemini 3 Pro Preview est à 2512 et Claude Opus 4.6 à 2352.

Codeforces

De plus, sur la référence MMMU-Pro pour la compréhension et le raisonnement multimodaux, Deep Think est également en tête avec 81,5 %, mais ici, les écarts entre les différents modèles ne sont pas si importants : Gemini 3 Pro Preview 81,0 %, GPT-5.2 79,5 %, Claude Opus 4.6 73,9 %.

MMMU-Pro

En plus des scores, Deep Think a également obtenu un résultat de niveau médaille d'or dans la partie écrite des Olympiades de physique et de chimie de 2025.

Résoudre les problèmes scientifiques

Google DeepMind a particulièrement souligné cette fois que Deep Think mis à niveau n'est plus seulement une machine à résoudre des problèmes, mais doit résoudre des problèmes scientifiques et d'ingénierie du monde réel.

Problèmes scientifiques

Ils ont présenté le cas du Wang Lab de l'Université Duke : des chercheurs utilisent Deep Think pour concevoir de nouveaux matériaux semi-conducteurs et optimiser le processus de croissance de cristaux complexes, qui sont des matériaux candidats pour les semi-conducteurs à haute température.

Cas Duke

Ingénierie mécanique

Il y a aussi des chercheurs dans le domaine de l'ingénierie mécanique qui l'utilisent pour itérer des prototypes physiques, permettant à l'itération du matériel d'atteindre la vitesse de l'itération du logiciel, ce qui signifie des cycles d'amélioration plus rapides dans des domaines tels que les dispositifs d'assistance.

Comment utiliser

Le mode Deep Think mis à niveau a maintenant commencé à être déployé dans l'application Gemini pour les abonnés Google AI Ultra.

Comment utiliser

Pour les chercheurs et les développeurs, Google a ouvert un programme d'accès anticipé Vertex AI, qui peut être utilisé via l'API.

Accès anticipé Vertex AI : https://goo.gle/4rMHUlq

Google met discrètement à niveau Deep Think, ARC-AGI-2 atteint directement 84,6 %

Google met discrètement à niveau Deep Think, ARC-AGI-2 atteint directement 84,6 %

Pas seulement le raisonnement

Résoudre les problèmes scientifiques

Comment utiliser

You Might Also Like

Guide de modification de Claude Code Buddy : Comment obtenir un animal de compagnie légendaire brillant

Obsidian a lancé Defuddle, élevant Obsidian Web Clipper à un nouveau niveau

OpenAI annonce soudainement "trois en un" : fusion du navigateur + programmation + ChatGPT, admettant en interne avoir pris le mauvais chemin l'année dernière

2026, ne vous forcez plus à être 'discipliné' ! Faites ces 8 petites choses, la santé viendra naturellement

Ces mamans qui luttent pour perdre du poids mais n'y arrivent pas, sont certainement piégées ici

Guide de fonctionnement stable de l'AI Browser 24 heures sur 24