Google a actualizat în liniște Deep Think, ARC-AGI-2 ajungând direct la 84,6%
Google a actualizat în liniște Deep Think, ARC-AGI-2 ajungând direct la 84,6%
Recent, Google DeepMind a actualizat modul de inferență dedicat Gemini 3, Deep Think, iar scorurile au depășit toate clasamentele.

Trebuie să știți că ARC-AGI-2 este în prezent un standard de referință de ultimă oră recunoscut pentru testarea capacității de inferență a AI, iar până acum niciun model nu a obținut un scor deosebit de bun pe acesta.

Iar Deep Think actualizat a obținut 84,6%, comparați cu: Claude Opus 4.6 are 68,8%, GPT-5.2 are 52,9%, iar chiar și Gemini 3 Pro Preview al lor are doar 31,1%.
Îmbunătățire uriașă.
Nu doar inferență
Ambiția Deep Think este evident mai mare decât inferența.

Pe standardul de referință Humanity's Last Exam, care este numit „Ultimul examen al umanității”, Deep Think a obținut 48,4%, acest test acoperă cele mai dificile probleme din domeniile matematicii, științei și ingineriei. Claude Opus 4.6 a obținut 40,0%, iar GPT-5.2 are 34,5%.
Și programarea este, de asemenea, foarte puternică:
Pe Codeforces, Deep Think a atins Elo 3455, în timp ce Gemini 3 Pro Preview are 2512, iar Claude Opus 4.6 are 2352.

În plus, pe standardul de referință MMMU-Pro pentru înțelegerea și inferența multimodală, Deep Think conduce, de asemenea, cu 81,5%, dar aici diferența dintre companii nu este atât de mare: Gemini 3 Pro Preview 81,0%, GPT-5.2 79,5%, Claude Opus 4.6 73,9%.

Pe lângă scoruri, Deep Think a obținut, de asemenea, un rezultat de nivelul medaliei de aur la partea scrisă a Olimpiadei de Fizică și Chimie din 2025.
Pentru a rezolva probleme științifice
Google DeepMind a subliniat în mod special de data aceasta că Deep Think actualizat nu mai este doar o mașină de rezolvat probleme, ci este menit să rezolve probleme științifice și inginerești din lumea reală.

Ei au prezentat cazul Wang Lab de la Universitatea Duke: cercetătorii folosesc Deep Think pentru a proiecta noi materiale semiconductoare, optimizând procesul complex de creștere a cristalelor, aceste cristale fiind materiale candidate pentru semiconductori de înaltă temperatură.


De asemenea, cercetătorii din domeniul ingineriei mecanice îl folosesc pentru a itera prototipuri fizice, permițând iterarea hardware-ului să atingă viteza iterării software-ului, ceea ce înseamnă cicluri de îmbunătățire mai rapide în domenii precum dispozitivele de asistență.
Cum se utilizează
Modul Deep Think actualizat a început acum să fie transmis utilizatorilor abonați Google AI Ultra în aplicația Gemini.

Pentru cercetători și dezvoltatori, Google a deschis programul de acces timpuriu Vertex AI, care poate fi utilizat prin API.
Vertex AI 早期访问:https://goo.gle/4rMHUlq (Acces timpuriu Vertex AI: https://goo.gle/4rMHUlq)





