Google a actualizat în liniște Deep Think, ARC-AGI-2 ajungând direct la 84,6%

2/14/2026
3 min read

Google a actualizat în liniște Deep Think, ARC-AGI-2 ajungând direct la 84,6%

Recent, Google DeepMind a actualizat modul de inferență dedicat Gemini 3, Deep Think, iar scorurile au depășit toate clasamentele.

Deep Think

Trebuie să știți că ARC-AGI-2 este în prezent un standard de referință de ultimă oră recunoscut pentru testarea capacității de inferență a AI, iar până acum niciun model nu a obținut un scor deosebit de bun pe acesta.

基准对比

Iar Deep Think actualizat a obținut 84,6%, comparați cu: Claude Opus 4.6 are 68,8%, GPT-5.2 are 52,9%, iar chiar și Gemini 3 Pro Preview al lor are doar 31,1%.

Îmbunătățire uriașă.

Nu doar inferență

Ambiția Deep Think este evident mai mare decât inferența.

不止推理

Pe standardul de referință Humanity's Last Exam, care este numit „Ultimul examen al umanității”, Deep Think a obținut 48,4%, acest test acoperă cele mai dificile probleme din domeniile matematicii, științei și ingineriei. Claude Opus 4.6 a obținut 40,0%, iar GPT-5.2 are 34,5%.

Și programarea este, de asemenea, foarte puternică:

Pe Codeforces, Deep Think a atins Elo 3455, în timp ce Gemini 3 Pro Preview are 2512, iar Claude Opus 4.6 are 2352.

Codeforces

În plus, pe standardul de referință MMMU-Pro pentru înțelegerea și inferența multimodală, Deep Think conduce, de asemenea, cu 81,5%, dar aici diferența dintre companii nu este atât de mare: Gemini 3 Pro Preview 81,0%, GPT-5.2 79,5%, Claude Opus 4.6 73,9%.

MMMU-Pro

Pe lângă scoruri, Deep Think a obținut, de asemenea, un rezultat de nivelul medaliei de aur la partea scrisă a Olimpiadei de Fizică și Chimie din 2025.

Pentru a rezolva probleme științifice

Google DeepMind a subliniat în mod special de data aceasta că Deep Think actualizat nu mai este doar o mașină de rezolvat probleme, ci este menit să rezolve probleme științifice și inginerești din lumea reală.

科学问题

Ei au prezentat cazul Wang Lab de la Universitatea Duke: cercetătorii folosesc Deep Think pentru a proiecta noi materiale semiconductoare, optimizând procesul complex de creștere a cristalelor, aceste cristale fiind materiale candidate pentru semiconductori de înaltă temperatură.

Duke案例

机械工程

De asemenea, cercetătorii din domeniul ingineriei mecanice îl folosesc pentru a itera prototipuri fizice, permițând iterarea hardware-ului să atingă viteza iterării software-ului, ceea ce înseamnă cicluri de îmbunătățire mai rapide în domenii precum dispozitivele de asistență.

Cum se utilizează

Modul Deep Think actualizat a început acum să fie transmis utilizatorilor abonați Google AI Ultra în aplicația Gemini.

如何使用

Pentru cercetători și dezvoltatori, Google a deschis programul de acces timpuriu Vertex AI, care poate fi utilizat prin API.

Vertex AI 早期访问:https://goo.gle/4rMHUlq (Acces timpuriu Vertex AI: https://goo.gle/4rMHUlq)

Published in Technology

You Might Also Like