Google je tiho nadogradio Deep Think, ARC-AGI-2 direktno do 84,6%

2/14/2026
2 min read

Google je tiho nadogradio Deep Think, ARC-AGI-2 direktno do 84,6%

Upravo je Google DeepMind nadogradio Gemini 3-ov namenski režim zaključivanja Deep Think, i rezultati su direktno pokorili sve liste.

Deep Think

Treba znati da je ARC-AGI-2 trenutno priznat kao vodeći standard za testiranje AI sposobnosti zaključivanja, i do sada nijedan model nije uspeo da postigne posebno dobre rezultate na njemu.

基准对比

Ažurirani Deep Think je osvojio 84,6%, uporedimo: Claude Opus 4.6 je 68,8%, GPT-5.2 je 52,9%, čak i Gemini 3 Pro Preview je samo 31,1%.

Ogroman napredak.

Ne samo zaključivanje

Deep Think očigledno ima ambicije koje prevazilaze samo zaključivanje.

不止推理

Na Humanity's Last Exam, koji se naziva "poslednji ljudski ispit", Deep Think je postigao 48,4%. Ovaj test pokriva najteža pitanja iz matematike, nauke i inženjerstva. Claude Opus 4.6 je dobio 40,0%, a GPT-5.2 34,5%.

Programiranje je takođe veoma jako:

Na Codeforces, Deep Think je dostigao Elo 3455, dok je Gemini 3 Pro Preview 2512, a Claude Opus 4.6 2352.

Codeforces

Pored toga, na MMMU-Pro standardu za multimodalno razumevanje i zaključivanje, Deep Think takođe prednjači sa 81,5%, ali ovde razlike između različitih kompanija nisu toliko velike: Gemini 3 Pro Preview 81,0%, GPT-5.2 79,5%, Claude Opus 4.6 73,9%.

MMMU-Pro

Pored rezultata, Deep Think je takođe postigao nivo zlatne medalje na pismenom delu Olimpijade iz fizike i hemije 2025.

Za rešavanje naučnih problema

Google DeepMind je ovog puta posebno naglasio da ažurirani Deep Think nije samo mašina za rešavanje problema, već treba da rešava stvarne naučne i inženjerske probleme.

科学问题

Oni su prikazali slučaj Wang Lab-a sa Univerziteta Duke: istraživači koriste Deep Think za dizajniranje novih poluprovodničkih materijala, optimizaciju procesa rasta složenih kristala, koji su kandidati za poluprovodnike visoke temperature.

Duke案例

机械工程

Takođe, istraživači u oblasti mašinstva ga koriste za iteriranje fizičkih prototipova, omogućavajući da iteracija hardvera dostigne brzinu iteracije softvera, što u oblastima kao što su pomoćni uređaji znači brže cikluse poboljšanja.

Kako koristiti

Ažurirani Deep Think režim je sada počeo da se uvodi u Gemini App za korisnike Google AI Ultra pretplate.

如何使用

Za istraživače i programere, Google je otvorio Vertex AI program ranog pristupa, koji se može koristiti preko API-ja.

Vertex AI 早期访问:https://goo.gle/4rMHUlq (Vertex AI program ranog pristupa: https://goo.gle/4rMHUlq)

Published in Technology

You Might Also Like