Google uppfærði hljóðlega Deep Think, ARC-AGI-2 fór beint upp í 84,6%
Google uppfærði hljóðlega Deep Think, ARC-AGI-2 fór beint upp í 84,6%
Nýlega uppfærði Google DeepMind sérstaka ályktunarhaminn Deep Think fyrir Gemini 3, og skoraði beint hæst á öllum listum.

Það skal tekið fram að ARC-AGI-2 er almennt viðurkennd sem fremsta viðmiðunin til að prófa ályktunargetu gervigreindar og engin fyrri líkön hafa náð sérstaklega góðum árangri á því.

En uppfærða Deep Think náði 84,6%, til samanburðar: Claude Opus 4.6 er 68,8%, GPT-5.2 er 52,9% og jafnvel Gemini 3 Pro Preview frá þeim sjálfum er aðeins 31,1%.
Mikil framför.
Meira en bara ályktun
Ljóst er að Deep Think stefnir á meira en bara ályktun.

Á Humanity's Last Exam, sem er kölluð „síðasta próf mannkynsins“, náði Deep Think 48,4%, en þetta próf nær yfir erfiðustu spurningarnar á sviði stærðfræði, vísinda og verkfræði. Claude Opus 4.6 fékk 40,0% og GPT-5.2 fékk 34,5%.
Forritunarhliðin er líka sterk:
Á Codeforces náði Deep Think Elo 3455, en Gemini 3 Pro Preview er 2512 og Claude Opus 4.6 er 2352.

Auk þess, á MMMU-Pro viðmiðinu fyrir fjölþætta skilning og ályktun, er Deep Think einnig í forystu með 81,5%, en munurinn á milli fyrirtækja er ekki svo mikill hér: Gemini 3 Pro Preview 81,0%, GPT-5.2 79,5%, Claude Opus 4.6 73,9%.

Fyrir utan stigagjöf fékk Deep Think einnig gullverðlaunastig í skriflegum hluta eðlis- og efnafræðikeppni Ólympíuleikanna 2025.
Að leysa vísindaleg vandamál
Google DeepMind lagði sérstaka áherslu á að uppfærða Deep Think sé ekki lengur bara vél til að leysa vandamál, heldur til að leysa raunveruleg vísinda- og verkfræðileg vandamál.

Þeir sýndu dæmi frá Wang Lab við Duke háskóla: Vísindamenn nota Deep Think til að hanna ný hálfleiðaraefni og fínstilla flókið kristalvöxt, en þessir kristallar eru möguleg efni fyrir háhita hálfleiðara.


Einnig nota vísindamenn á sviði vélaverkfræði það til að endurtaka eðlisfræðilegar frumgerðir, sem gerir vélbúnaðarendurtekningu kleift að ná hraða hugbúnaðarendurtekningar, sem þýðir hraðari endurbótahringrás á sviðum eins og hjálpartækjum.
Hvernig á að nota
Uppfærða Deep Think hamurinn er nú þegar byrjaður að vera ýtt út í Gemini App fyrir Google AI Ultra áskrifendur.

Fyrir vísindamenn og forritara hefur Google opnað Vertex AI snemmtækt aðgangsáætlun, sem hægt er að nota í gegnum API.
Vertex AI snemmtækur aðgangur: https://goo.gle/4rMHUlq





