Google Deep Think-ті жасырын түрде жаңартты, ARC-AGI-2 бірден 84.6%-ға жетті

Жаңа ғана, Google DeepMind Gemini 3-тің арнайы пайымдау режимі Deep Think-ті жаңартты, нәтижелер бірден көш бастады.

Deep Think

Білу керек, ARC-AGI-2 қазіргі уақытта AI пайымдау қабілетін тексеретін алдыңғы қатарлы эталон болып саналады, бұған дейін ешбір модель бұнда жақсы нәтиже көрсете алмаған.

Эталонды салыстыру

Ал жаңартылған Deep Think 84.6%-ды иеленді, салыстырып көрейік: Claude Opus 4.6 - 68.8%, GPT-5.2 - 52.9%, тіпті өздерінің Gemini 3 Pro Preview-і де 31.1% ғана.

Өте үлкен жетістік.

Тек пайымдау ғана емес

Deep Think-тің амбициясы пайымдаумен шектелмейтіні анық.

Тек пайымдау ғана емес

«Адамзаттың соңғы емтиханы» деп аталатын Humanity's Last Exam эталонында Deep Think 48.4%-ды алды, бұл тест математика, ғылым және инженерия саласындағы ең қиын сұрақтарды қамтиды. Claude Opus 4.6 - 40.0%, GPT-5.2 - 34.5% алды.

Бағдарламалау жағынан да өте мықты:

Codeforces-та Deep Think Elo 3455-ке жетті, ал Gemini 3 Pro Preview - 2512, Claude Opus 4.6 - 2352.

Codeforces

Сонымен қатар, көп модальды түсіну және пайымдаудың MMMU-Pro эталонында Deep Think 81.5%-бен көш бастады, бірақ бұл жерде барлығының арасындағы айырмашылық соншалықты үлкен емес: Gemini 3 Pro Preview 81.0%, GPT-5.2 79.5%, Claude Opus 4.6 73.9%.

MMMU-Pro

Нәтижелерден басқа, Deep Think 2025 жылғы физика және химия олимпиадаларының жазбаша бөлімінде алтын медаль деңгейіндегі нәтижеге қол жеткізді.

Ғылыми мәселелерді шешу керек

Google DeepMind бұл жолы жаңартылған Deep Think тек есеп шығаратын машина емес, нақты әлемдегі ғылыми және инженерлік мәселелерді шешуі керек екенін ерекше атап өтті.

Ғылыми мәселелер

Олар Duke университетінің Wang Lab мысалын көрсетті: зерттеушілер Deep Think-ті жаңа жартылай өткізгіш материалдарды жобалау, күрделі кристалдардың өсу процесін оңтайландыру үшін пайдаланады, бұл кристалдар жоғары температуралы жартылай өткізгіштердің кандидат материалдары болып табылады.

Duke мысалы

Механикалық инженерия

Сондай-ақ, механикалық инженерия саласындағы зерттеушілер оны физикалық прототиптерді итерациялау үшін пайдаланады, бұл аппараттық құралдардың итерациясын бағдарламалық құралдардың итерациясының жылдамдығына жеткізеді, бұл көмекші құрылғылар сияқты салаларда жақсарту циклінің жылдамдығын білдіреді.

Қалай пайдалануға болады

Жаңартылған Deep Think режимі қазірдің өзінде Gemini App-те Google AI Ultra жазылушыларына жіберіле бастады.

Қалай пайдалануға болады

Ғылыми қызметкерлер мен әзірлеушілер үшін Google Vertex AI ерте қол жеткізу жоспарын ашты, оны API арқылы пайдалануға болады.

Vertex AI ерте қол жеткізу: https://goo.gle/4rMHUlq

Google Deep Think-ті жасырын түрде жаңартты, ARC-AGI-2 бірден 84.6%-ға жетті

Google Deep Think-ті жасырын түрде жаңартты, ARC-AGI-2 бірден 84.6%-ға жетті

Тек пайымдау ғана емес

Ғылыми мәселелерді шешу керек

Қалай пайдалануға болады

You Might Also Like

Claude Code Buddy өзгерту нұсқаулығы: қалай жарқыраған аңыз деңгейіндегі питомец алуға болады

Obsidian Defuddle-ды шығарды, Obsidian Web Clipper-ді жаңа деңгейге көтерді

OpenAI кенеттен "үш бірлікті" жариялады: браузер + бағдарламалау + ChatGPT бірігуі, ішкі деңгейде өткен жылы қателескенін мойындады

2026, өзіңізді "тәртіпке" мәжбүрлемеңіз! Бұл 8 кішігірім істі орындаңыз, денсаулық өздігінен келеді

Салмақ тастауға тырысқан, бірақ арықтай алмай жүрген аналар, мүлдем осында құлайды

AI Browser 24 сағат тұрақты жұмыс істеу нұсқаулығы