Google Deep Think-ті жасырын түрде жаңартты, ARC-AGI-2 бірден 84.6%-ға жетті
Google Deep Think-ті жасырын түрде жаңартты, ARC-AGI-2 бірден 84.6%-ға жетті
Жаңа ғана, Google DeepMind Gemini 3-тің арнайы пайымдау режимі Deep Think-ті жаңартты, нәтижелер бірден көш бастады.

Білу керек, ARC-AGI-2 қазіргі уақытта AI пайымдау қабілетін тексеретін алдыңғы қатарлы эталон болып саналады, бұған дейін ешбір модель бұнда жақсы нәтиже көрсете алмаған.

Ал жаңартылған Deep Think 84.6%-ды иеленді, салыстырып көрейік: Claude Opus 4.6 - 68.8%, GPT-5.2 - 52.9%, тіпті өздерінің Gemini 3 Pro Preview-і де 31.1% ғана.
Өте үлкен жетістік.
Тек пайымдау ғана емес
Deep Think-тің амбициясы пайымдаумен шектелмейтіні анық.

«Адамзаттың соңғы емтиханы» деп аталатын Humanity's Last Exam эталонында Deep Think 48.4%-ды алды, бұл тест математика, ғылым және инженерия саласындағы ең қиын сұрақтарды қамтиды. Claude Opus 4.6 - 40.0%, GPT-5.2 - 34.5% алды.
Бағдарламалау жағынан да өте мықты:
Codeforces-та Deep Think Elo 3455-ке жетті, ал Gemini 3 Pro Preview - 2512, Claude Opus 4.6 - 2352.

Сонымен қатар, көп модальды түсіну және пайымдаудың MMMU-Pro эталонында Deep Think 81.5%-бен көш бастады, бірақ бұл жерде барлығының арасындағы айырмашылық соншалықты үлкен емес: Gemini 3 Pro Preview 81.0%, GPT-5.2 79.5%, Claude Opus 4.6 73.9%.

Нәтижелерден басқа, Deep Think 2025 жылғы физика және химия олимпиадаларының жазбаша бөлімінде алтын медаль деңгейіндегі нәтижеге қол жеткізді.
Ғылыми мәселелерді шешу керек
Google DeepMind бұл жолы жаңартылған Deep Think тек есеп шығаратын машина емес, нақты әлемдегі ғылыми және инженерлік мәселелерді шешуі керек екенін ерекше атап өтті.

Олар Duke университетінің Wang Lab мысалын көрсетті: зерттеушілер Deep Think-ті жаңа жартылай өткізгіш материалдарды жобалау, күрделі кристалдардың өсу процесін оңтайландыру үшін пайдаланады, бұл кристалдар жоғары температуралы жартылай өткізгіштердің кандидат материалдары болып табылады.


Сондай-ақ, механикалық инженерия саласындағы зерттеушілер оны физикалық прототиптерді итерациялау үшін пайдаланады, бұл аппараттық құралдардың итерациясын бағдарламалық құралдардың итерациясының жылдамдығына жеткізеді, бұл көмекші құрылғылар сияқты салаларда жақсарту циклінің жылдамдығын білдіреді.
Қалай пайдалануға болады
Жаңартылған Deep Think режимі қазірдің өзінде Gemini App-те Google AI Ultra жазылушыларына жіберіле бастады.

Ғылыми қызметкерлер мен әзірлеушілер үшін Google Vertex AI ерте қол жеткізу жоспарын ашты, оны API арқылы пайдалануға болады.
Vertex AI ерте қол жеткізу: https://goo.gle/4rMHUlq





