Google potichu vylepšil Deep Think, ARC-AGI-2 priamo na 84,6 %
Google potichu vylepšil Deep Think, ARC-AGI-2 priamo na 84,6 %
Práve teraz Google DeepMind vylepšil špeciálny režim odvodzovania Gemini 3, Deep Think, a výsledky priamo prevalcovali rebríčky.

Treba si uvedomiť, že ARC-AGI-2 je v súčasnosti uznávaný ako špičkový benchmark pre testovanie schopností AI odvodzovať, a predtým žiadny model na ňom nedosiahol obzvlášť dobré skóre.

Vylepšený Deep Think dosiahol 84,6 %, pre porovnanie: Claude Opus 4.6 má 68,8 %, GPT-5.2 má 52,9 % a dokonca aj Gemini 3 Pro Preview má len 31,1 %.
Obrovské zlepšenie.
Nielen odvodzovanie
Ambície Deep Think sú zjavne viac než len odvodzovanie.

Na benchmarku Humanity's Last Exam, ktorý sa nazýva „posledná skúška ľudstva“, Deep Think dosiahol 48,4 %. Tento test pokrýva najťažšie problémy v oblasti matematiky, vedy a inžinierstva. Claude Opus 4.6 dosiahol 40,0 % a GPT-5.2 34,5 %.
Programovanie je tiež veľmi silné:
Na Codeforces dosiahol Deep Think Elo 3455, zatiaľ čo Gemini 3 Pro Preview má 2512 a Claude Opus 4.6 má 2352.

Okrem toho, na benchmarku MMMU-Pro pre multimodálne porozumenie a odvodzovanie, Deep Think tiež vedie s 81,5 %, ale rozdiely medzi jednotlivými spoločnosťami tu nie sú také veľké: Gemini 3 Pro Preview 81,0 %, GPT-5.2 79,5 %, Claude Opus 4.6 73,9 %.

Okrem výsledkov benchmarkov, Deep Think tiež dosiahol úroveň zlatej medaily v písomnej časti Fyzikálnej a chemickej olympiády v roku 2025.
Riešiť vedecké problémy
Google DeepMind tentokrát špeciálne zdôraznil, že vylepšený Deep Think už nie je len stroj na riešenie problémov, ale má riešiť skutočné vedecké a inžinierske problémy.

Ukázali prípad Wang Lab na Duke University: vedci používajú Deep Think na navrhovanie nových polovodičových materiálov a optimalizáciu procesu rastu komplexných kryštálov, ktoré sú kandidátmi na vysokoteplotné polovodiče.


Výskumníci v oblasti strojárstva ho tiež používajú na iteráciu fyzických prototypov, čo umožňuje iteráciu hardvéru dosiahnuť rýchlosť iterácie softvéru, čo znamená rýchlejšie cykly zlepšovania v oblastiach, ako sú pomocné zariadenia.
Ako používať
Vylepšený režim Deep Think sa teraz začal zavádzať v aplikácii Gemini pre používateľov predplatného Google AI Ultra.

Pre výskumníkov a vývojárov Google otvoril program skorého prístupu Vertex AI, ktorý je možné použiť prostredníctvom API.
Vertex AI skorý prístup: https://goo.gle/4rMHUlq





