Google je tiho nadogradio Deep Think, ARC-AGI-2 direktno do 84,6%

2/14/2026
2 min read

Google je tiho nadogradio Deep Think, ARC-AGI-2 direktno do 84,6%

Upravo je Google DeepMind nadogradio Gemini 3-ov namenski režim zaključivanja Deep Think, i rezultati su direktno pokorili sve liste.

Deep Think

Treba znati da je ARC-AGI-2 trenutno priznat kao vodeći standard za testiranje AI sposobnosti zaključivanja, i do sada nijedan model nije uspeo da postigne posebno dobre rezultate na njemu.

基准对比

Ažurirani Deep Think je osvojio 84,6%, uporedimo: Claude Opus 4.6 je 68,8%, GPT-5.2 je 52,9%, čak i Gemini 3 Pro Preview je samo 31,1%.

Ogroman napredak.

Ne samo zaključivanje

Deep Think očigledno ima ambicije koje prevazilaze samo zaključivanje.

不止推理

Na Humanity's Last Exam, koji se naziva "poslednji ljudski ispit", Deep Think je postigao 48,4%. Ovaj test pokriva najteža pitanja iz matematike, nauke i inženjerstva. Claude Opus 4.6 je dobio 40,0%, a GPT-5.2 34,5%.

Programiranje je takođe veoma jako:

Na Codeforces, Deep Think je dostigao Elo 3455, dok je Gemini 3 Pro Preview 2512, a Claude Opus 4.6 2352.

Codeforces

Pored toga, na MMMU-Pro standardu za multimodalno razumevanje i zaključivanje, Deep Think takođe prednjači sa 81,5%, ali ovde razlike između različitih kompanija nisu toliko velike: Gemini 3 Pro Preview 81,0%, GPT-5.2 79,5%, Claude Opus 4.6 73,9%.

MMMU-Pro

Pored rezultata, Deep Think je takođe postigao nivo zlatne medalje na pismenom delu Olimpijade iz fizike i hemije 2025.

Za rešavanje naučnih problema

Google DeepMind je ovog puta posebno naglasio da ažurirani Deep Think nije samo mašina za rešavanje problema, već treba da rešava stvarne naučne i inženjerske probleme.

科学问题

Oni su prikazali slučaj Wang Lab-a sa Univerziteta Duke: istraživači koriste Deep Think za dizajniranje novih poluprovodničkih materijala, optimizaciju procesa rasta složenih kristala, koji su kandidati za poluprovodnike visoke temperature.

Duke案例

机械工程

Takođe, istraživači u oblasti mašinstva ga koriste za iteriranje fizičkih prototipova, omogućavajući da iteracija hardvera dostigne brzinu iteracije softvera, što u oblastima kao što su pomoćni uređaji znači brže cikluse poboljšanja.

Kako koristiti

Ažurirani Deep Think režim je sada počeo da se uvodi u Gemini App za korisnike Google AI Ultra pretplate.

如何使用

Za istraživače i programere, Google je otvorio Vertex AI program ranog pristupa, koji se može koristiti preko API-ja.

Vertex AI 早期访问:https://goo.gle/4rMHUlq (Vertex AI program ranog pristupa: https://goo.gle/4rMHUlq)

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy модификација: Како добити сјајног легендарног љубимца

Claude Code Buddy модификација: Како добити сјајног легендарног љубимца априла 2026. године, Anthropic је у верзији Clau...

Obsidian je lansirao Defuddle, podigao Obsidian Web Clipper na novi nivoTechnology

Obsidian je lansirao Defuddle, podigao Obsidian Web Clipper na novi nivo

Obsidian je lansirao Defuddle, podigao Obsidian Web Clipper na novi nivo Uvek sam voleo osnovnu ideju Obsidiana: lokaln...

OpenAI iznenada najavljuje "tri u jednom": spajanje pretraživača + programiranja + ChatGPT, unutrašnje priznanje da su prošle godine pogrešiliTechnology

OpenAI iznenada najavljuje "tri u jednom": spajanje pretraživača + programiranja + ChatGPT, unutrašnje priznanje da su prošle godine pogrešili

OpenAI iznenada najavljuje "tri u jednom": spajanje pretraživača + programiranja + ChatGPT, unutrašnje priznanje da su p...

2026, ne prisiljavajte se na "disciplinu"! Uradite ovih 8 malih stvari, zdravlje će doći prirodnoHealth

2026, ne prisiljavajte se na "disciplinu"! Uradite ovih 8 malih stvari, zdravlje će doći prirodno

2026, ne prisiljavajte se na "disciplinu"! Uradite ovih 8 malih stvari, zdravlje će doći prirodno Nova godina je počela...

One of the reasons why mothers who work hard to lose weight can't succeed is definitely hereHealth

One of the reasons why mothers who work hard to lose weight can't succeed is definitely here

One of the reasons why mothers who work hard to lose weight can't succeed is definitely here Mart je već prošao, kako n...

📝
Technology

AI Browser 24-сатна стабилна операција

AI Browser 24-сатна стабилна операција Овај водич описује како да се подеси стабилно, дугорочно окружење за AI прегледач...