Google je tiho nadogradio Deep Think, ARC-AGI-2 direktno do 84,6%

2/14/2026
2 min read

Google je tiho nadogradio Deep Think, ARC-AGI-2 direktno do 84,6%

Upravo sada, Google DeepMind je nadogradio Gemini 3 namjenski način zaključivanja Deep Think, rezultati su direktno pokorili sve liste.

Deep Think

Treba znati da je ARC-AGI-2 trenutno priznati vrhunski standard za testiranje AI sposobnosti zaključivanja, a prije toga nijedan model nije uspio postići posebno dobre rezultate na njemu.

基准对比

A nadograđeni Deep Think je postigao 84,6%, usporedbe radi: Claude Opus 4.6 je 68,8%, GPT-5.2 je 52,9%, a čak i vlastiti Gemini 3 Pro Preview je samo 31,1%.

Ogroman napredak.

Ne samo zaključivanje

Ambicioznost Deep Think-a očito se ne zaustavlja samo na zaključivanju.

不止推理

Na Humanity's Last Exam, koji se naziva "posljednji ispit čovječanstva", Deep Think je postigao 48,4%. Ovaj test pokriva najteža pitanja iz matematike, znanosti i inženjerstva. Claude Opus 4.6 je dobio 40,0%, a GPT-5.2 je 34,5%.

Programiranje je također vrlo jako:

Na Codeforces, Deep Think je dosegao Elo 3455, dok je Gemini 3 Pro Preview 2512, a Claude Opus 4.6 je 2352.

Codeforces

Pored toga, na MMMU-Pro standardu za multimodalno razumijevanje i zaključivanje, Deep Think također vodi s 81,5%, ali ovdje razlika između različitih kompanija nije toliko velika: Gemini 3 Pro Preview 81,0%, GPT-5.2 79,5%, Claude Opus 4.6 73,9%.

MMMU-Pro

Osim rezultata, Deep Think je također postigao rezultat na razini zlatne medalje na pismenom dijelu Olimpijade iz fizike i kemije 2025.

Za rješavanje znanstvenih problema

Google DeepMind je ovaj put posebno naglasio da nadograđeni Deep Think više nije samo stroj za rješavanje problema, već za rješavanje stvarnih znanstvenih i inženjerskih problema.

科学问题

Pokazali su primjer Wang Lab-a sa Sveučilišta Duke: istraživači koriste Deep Think za dizajniranje novih poluvodičkih materijala i optimizaciju procesa rasta složenih kristala, koji su kandidati za visokotemperaturne poluvodiče.

Duke案例

机械工程

Tu su i istraživači u području strojarstva koji ga koriste za iteriranje fizičkih prototipova, omogućujući iteraciju hardvera brzinom iteracije softvera, što znači brže cikluse poboljšanja u područjima kao što su pomoćni uređaji.

Kako koristiti

Nadograđeni Deep Think način rada sada se počinje uvoditi u aplikaciji Gemini za korisnike pretplate na Google AI Ultra.

如何使用

Za istraživače i programere, Google je otvorio Vertex AI program ranog pristupa, koji se može koristiti putem API-ja.

Vertex AI 早期访问:https://goo.gle/4rMHUlq

Published in Technology

You Might Also Like