Google Deep Think-ті жасырын түрде жаңартты, ARC-AGI-2 бірден 84.6%-ға жетті

2/14/2026
2 min read

Google Deep Think-ті жасырын түрде жаңартты, ARC-AGI-2 бірден 84.6%-ға жетті

Жаңа ғана, Google DeepMind Gemini 3-тің арнайы пайымдау режимі Deep Think-ті жаңартты, нәтижелер бірден көш бастады.

Deep Think

Білу керек, ARC-AGI-2 қазіргі уақытта AI пайымдау қабілетін тексеретін алдыңғы қатарлы эталон болып саналады, бұған дейін ешбір модель бұнда жақсы нәтиже көрсете алмаған.

Эталонды салыстыру

Ал жаңартылған Deep Think 84.6%-ды иеленді, салыстырып көрейік: Claude Opus 4.6 - 68.8%, GPT-5.2 - 52.9%, тіпті өздерінің Gemini 3 Pro Preview-і де 31.1% ғана.

Өте үлкен жетістік.

Тек пайымдау ғана емес

Deep Think-тің амбициясы пайымдаумен шектелмейтіні анық.

Тек пайымдау ғана емес

«Адамзаттың соңғы емтиханы» деп аталатын Humanity's Last Exam эталонында Deep Think 48.4%-ды алды, бұл тест математика, ғылым және инженерия саласындағы ең қиын сұрақтарды қамтиды. Claude Opus 4.6 - 40.0%, GPT-5.2 - 34.5% алды.

Бағдарламалау жағынан да өте мықты:

Codeforces-та Deep Think Elo 3455-ке жетті, ал Gemini 3 Pro Preview - 2512, Claude Opus 4.6 - 2352.

Codeforces

Сонымен қатар, көп модальды түсіну және пайымдаудың MMMU-Pro эталонында Deep Think 81.5%-бен көш бастады, бірақ бұл жерде барлығының арасындағы айырмашылық соншалықты үлкен емес: Gemini 3 Pro Preview 81.0%, GPT-5.2 79.5%, Claude Opus 4.6 73.9%.

MMMU-Pro

Нәтижелерден басқа, Deep Think 2025 жылғы физика және химия олимпиадаларының жазбаша бөлімінде алтын медаль деңгейіндегі нәтижеге қол жеткізді.

Ғылыми мәселелерді шешу керек

Google DeepMind бұл жолы жаңартылған Deep Think тек есеп шығаратын машина емес, нақты әлемдегі ғылыми және инженерлік мәселелерді шешуі керек екенін ерекше атап өтті.

Ғылыми мәселелер

Олар Duke университетінің Wang Lab мысалын көрсетті: зерттеушілер Deep Think-ті жаңа жартылай өткізгіш материалдарды жобалау, күрделі кристалдардың өсу процесін оңтайландыру үшін пайдаланады, бұл кристалдар жоғары температуралы жартылай өткізгіштердің кандидат материалдары болып табылады.

Duke мысалы

Механикалық инженерия

Сондай-ақ, механикалық инженерия саласындағы зерттеушілер оны физикалық прототиптерді итерациялау үшін пайдаланады, бұл аппараттық құралдардың итерациясын бағдарламалық құралдардың итерациясының жылдамдығына жеткізеді, бұл көмекші құрылғылар сияқты салаларда жақсарту циклінің жылдамдығын білдіреді.

Қалай пайдалануға болады

Жаңартылған Deep Think режимі қазірдің өзінде Gemini App-те Google AI Ultra жазылушыларына жіберіле бастады.

Қалай пайдалануға болады

Ғылыми қызметкерлер мен әзірлеушілер үшін Google Vertex AI ерте қол жеткізу жоспарын ашты, оны API арқылы пайдалануға болады.

Vertex AI ерте қол жеткізу: https://goo.gle/4rMHUlq

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy өзгерту нұсқаулығы: қалай жарқыраған аңыз деңгейіндегі питомец алуға болады

Claude Code Buddy өзгерту нұсқаулығы: қалай жарқыраған аңыз деңгейіндегі питомец алуға болады 2026 жылдың 1 сәуірінде, A...

Obsidian Defuddle-ды шығарды, Obsidian Web Clipper-ді жаңа деңгейге көтердіTechnology

Obsidian Defuddle-ды шығарды, Obsidian Web Clipper-ді жаңа деңгейге көтерді

Obsidian Defuddle-ды шығарды, Obsidian Web Clipper-ді жаңа деңгейге көтерді Мен Obsidian-ның негізгі идеясын әрқашан ұн...

OpenAI кенеттен "үш бірлікті" жариялады: браузер + бағдарламалау + ChatGPT бірігуі, ішкі деңгейде өткен жылы қателескенін мойындадыTechnology

OpenAI кенеттен "үш бірлікті" жариялады: браузер + бағдарламалау + ChatGPT бірігуі, ішкі деңгейде өткен жылы қателескенін мойындады

OpenAI кенеттен "үш бірлікті" жариялады: браузер + бағдарламалау + ChatGPT бірігуі, ішкі деңгейде өткен жылы қателескені...

2026, өзіңізді "тәртіпке" мәжбүрлемеңіз! Бұл 8 кішігірім істі орындаңыз, денсаулық өздігінен келедіHealth

2026, өзіңізді "тәртіпке" мәжбүрлемеңіз! Бұл 8 кішігірім істі орындаңыз, денсаулық өздігінен келеді

2026, өзіңізді "тәртіпке" мәжбүрлемеңіз! Бұл 8 кішігірім істі орындаңыз, денсаулық өздігінен келеді Жаңа жыл басталды, ...

Салмақ тастауға тырысқан, бірақ арықтай алмай жүрген аналар, мүлдем осында құлайдыHealth

Салмақ тастауға тырысқан, бірақ арықтай алмай жүрген аналар, мүлдем осында құлайды

[[HTMLPLACEHOLDER0]] Наурыздың жартысы өтті, сенің салмақ тастау жоспарың қалай? Арықтадың ба? Неше килограмм арықтадың...

📝
Technology

AI Browser 24 сағат тұрақты жұмыс істеу нұсқаулығы

AI Browser 24 сағат тұрақты жұмыс істеу нұсқаулығы Бұл нұсқаулық тұрақты, ұзақ мерзімді AI браузер ортасын қалай құруды ...