Google Deep Think-ті жасырын түрде жаңартты, ARC-AGI-2 бірден 84.6%-ға жетті

2/14/2026
2 min read

Google Deep Think-ті жасырын түрде жаңартты, ARC-AGI-2 бірден 84.6%-ға жетті

Жаңа ғана, Google DeepMind Gemini 3-тің арнайы пайымдау режимі Deep Think-ті жаңартты, нәтижелер бірден көш бастады.

Deep Think

Білу керек, ARC-AGI-2 қазіргі уақытта AI пайымдау қабілетін тексеретін алдыңғы қатарлы эталон болып саналады, бұған дейін ешбір модель бұнда жақсы нәтиже көрсете алмаған.

Эталонды салыстыру

Ал жаңартылған Deep Think 84.6%-ды иеленді, салыстырып көрейік: Claude Opus 4.6 - 68.8%, GPT-5.2 - 52.9%, тіпті өздерінің Gemini 3 Pro Preview-і де 31.1% ғана.

Өте үлкен жетістік.

Тек пайымдау ғана емес

Deep Think-тің амбициясы пайымдаумен шектелмейтіні анық.

Тек пайымдау ғана емес

«Адамзаттың соңғы емтиханы» деп аталатын Humanity's Last Exam эталонында Deep Think 48.4%-ды алды, бұл тест математика, ғылым және инженерия саласындағы ең қиын сұрақтарды қамтиды. Claude Opus 4.6 - 40.0%, GPT-5.2 - 34.5% алды.

Бағдарламалау жағынан да өте мықты:

Codeforces-та Deep Think Elo 3455-ке жетті, ал Gemini 3 Pro Preview - 2512, Claude Opus 4.6 - 2352.

Codeforces

Сонымен қатар, көп модальды түсіну және пайымдаудың MMMU-Pro эталонында Deep Think 81.5%-бен көш бастады, бірақ бұл жерде барлығының арасындағы айырмашылық соншалықты үлкен емес: Gemini 3 Pro Preview 81.0%, GPT-5.2 79.5%, Claude Opus 4.6 73.9%.

MMMU-Pro

Нәтижелерден басқа, Deep Think 2025 жылғы физика және химия олимпиадаларының жазбаша бөлімінде алтын медаль деңгейіндегі нәтижеге қол жеткізді.

Ғылыми мәселелерді шешу керек

Google DeepMind бұл жолы жаңартылған Deep Think тек есеп шығаратын машина емес, нақты әлемдегі ғылыми және инженерлік мәселелерді шешуі керек екенін ерекше атап өтті.

Ғылыми мәселелер

Олар Duke университетінің Wang Lab мысалын көрсетті: зерттеушілер Deep Think-ті жаңа жартылай өткізгіш материалдарды жобалау, күрделі кристалдардың өсу процесін оңтайландыру үшін пайдаланады, бұл кристалдар жоғары температуралы жартылай өткізгіштердің кандидат материалдары болып табылады.

Duke мысалы

Механикалық инженерия

Сондай-ақ, механикалық инженерия саласындағы зерттеушілер оны физикалық прототиптерді итерациялау үшін пайдаланады, бұл аппараттық құралдардың итерациясын бағдарламалық құралдардың итерациясының жылдамдығына жеткізеді, бұл көмекші құрылғылар сияқты салаларда жақсарту циклінің жылдамдығын білдіреді.

Қалай пайдалануға болады

Жаңартылған Deep Think режимі қазірдің өзінде Gemini App-те Google AI Ultra жазылушыларына жіберіле бастады.

Қалай пайдалануға болады

Ғылыми қызметкерлер мен әзірлеушілер үшін Google Vertex AI ерте қол жеткізу жоспарын ашты, оны API арқылы пайдалануға болады.

Vertex AI ерте қол жеткізу: https://goo.gle/4rMHUlq

Published in Technology

You Might Also Like

Бұлтты есептеу технологиясын қалай пайдалану керек: Сіздің алғашқы бұлттық инфрақұрылымыңызды құруға арналған толық нұсқаулықTechnology

Бұлтты есептеу технологиясын қалай пайдалану керек: Сіздің алғашқы бұлттық инфрақұрылымыңызды құруға арналған толық нұсқаулық

Бұлтты есептеу технологиясын қалай пайдалану керек: Сіздің алғашқы бұлттық инфрақұрылымыңызды құруға арналған толық нұсқ...

Ескерту! Claude Code-тың әкесі ашық айтты: 1 айдан кейін Plan Mode қолданылмайды, бағдарламалық инженер атағы жоғаладыTechnology

Ескерту! Claude Code-тың әкесі ашық айтты: 1 айдан кейін Plan Mode қолданылмайды, бағдарламалық инженер атағы жоғалады

Ескерту! Claude Code-тың әкесі ашық айтты: 1 айдан кейін Plan Mode қолданылмайды, бағдарламалық инженер атағы жоғалады ...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026 жылғы Топ 10 AI агенттері: Негізгі артықшылықтарды талдауTechnology

2026 жылғы Топ 10 AI агенттері: Негізгі артықшылықтарды талдау

2026 жылғы Топ 10 AI агенттері: Негізгі артықшылықтарды талдау Кіріспе Жасанды интеллекттің жылдам дамуы арқасында AI аг...

2026 жыл: Топ 10 AI құралдары ұсынысы: Жасанды интеллектінің шынайы әлеуетін ашуTechnology

2026 жыл: Топ 10 AI құралдары ұсынысы: Жасанды интеллектінің шынайы әлеуетін ашу

2026 жыл: Топ 10 AI құралдары ұсынысы: Жасанды интеллектінің шынайы әлеуетін ашу Технологияның жылдам дамып жатқан бүгін...

2026 жылғы AWS құралдары мен ресурстарының 10 үздігіTechnology

2026 жылғы AWS құралдары мен ресурстарының 10 үздігі

2026 жылғы AWS құралдары мен ресурстарының 10 үздігі Жылдам дамып келе жатқан бұлтты есептеу саласында Amazon Web Servic...