Google päivitti hiljaa Deep Thinkin, ARC-AGI-2 suoraan 84,6 %

2/14/2026
2 min read

Google päivitti hiljaa Deep Thinkin, ARC-AGI-2 suoraan 84,6 %

Juuri äsken Google DeepMind päivitti Gemini 3:n erikoistetun päättelytilan Deep Thinkin, ja tulokset murskaavat suoraan kaikki muut.

Deep Think

On hyvä muistaa, että ARC-AGI-2 on tällä hetkellä yleisesti tunnustettu tekoälyn päättelykyvyn testauksen huippumittari, ja aiemmin mikään malli ei ole saanut siinä erityisen hyviä pisteitä.

基准对比

Päivitetyn Deep Thinkin tulos oli 84,6 %. Vertailun vuoksi: Claude Opus 4.6 on 68,8 %, GPT-5.2 on 52,9 % ja jopa Googlen oma Gemini 3 Pro Preview vain 31,1 %.

Parannus on valtava.

Enemmän kuin vain päättely

Deep Thinkin tavoitteet ovat selvästi enemmän kuin vain päättely.

不止推理

Humanity's Last Exam -nimisessä mittarissa, jota kutsutaan "ihmiskunnan viimeiseksi kokeeksi", Deep Think sai 48,4 %. Tämä testi kattaa matematiikan, tieteen ja insinööritieteen vaikeimmat kysymykset. Claude Opus 4.6 sai 40,0 % ja GPT-5.2 34,5 %.

Ohjelmoinnin saralla se on myös kova:

Codeforcesissa Deep Think saavutti Elo 3455, kun taas Gemini 3 Pro Preview on 2512 ja Claude Opus 4.6 on 2352.

Codeforces

Lisäksi monimuotoisen ymmärryksen ja päättelyn MMMU-Pro-mittarissa Deep Think johtaa 81,5 %:lla, mutta tässä eri toimijoiden väliset erot eivät ole niin suuria: Gemini 3 Pro Preview 81,0 %, GPT-5.2 79,5 % ja Claude Opus 4.6 73,9 %.

MMMU-Pro

Pisteiden lisäksi Deep Think saavutti vuoden 2025 fysiikan ja kemian olympialaisten kirjallisessa osiossa kultamitalitason tuloksen.

Ongelmien ratkaiseminen tieteen saralla

Google DeepMind korosti tällä kertaa erityisesti, että päivitetty Deep Think ei ole enää vain ongelmanratkaisukone, vaan sen on tarkoitus ratkaista todellisia tieteen ja insinööritieteen ongelmia.

科学问题

He esittelivät Duke Universityn Wang Labin tapauksen: tutkijat käyttävät Deep Thinkiä uusien puolijohdemateriaalien suunnitteluun ja monimutkaisten kiteiden kasvun optimointiin. Nämä kiteet ovat korkean lämpötilan puolijohteiden ehdokasmateriaaleja.

Duke案例

机械工程

Myös koneenrakennuksen tutkijat käyttävät sitä fyysisten prototyyppien iterointiin, jolloin laitteistojen iterointi saavuttaa ohjelmistojen iterointinopeuden. Tämä tarkoittaa nopeampia parannusjaksoja esimerkiksi apuvälineiden alalla.

Kuinka käyttää

Päivitetty Deep Think -tila on nyt alettu lähettää Gemini-sovelluksessa Google AI Ultra -tilaajille.

如何使用

Tutkijoille ja kehittäjille Google on avannut Vertex AI:n varhaisen käyttöoikeuden, jota voi käyttää API:n kautta.

Vertex AI:n varhainen käyttöoikeus: https://goo.gle/4rMHUlq

Published in Technology

You Might Also Like

Kuinka käyttää pilvilaskentateknologiaa: Rakenna ensimmäinen pilvi-infrastruktuurisi täydellinen opasTechnology

Kuinka käyttää pilvilaskentateknologiaa: Rakenna ensimmäinen pilvi-infrastruktuurisi täydellinen opas

[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLD...

Varoitus! Claude Code isänsä Boris Cherny sanoo: Kuukauden kuluttua Plan Modea ei enää käytetä, ohjelmistosuunnittelijan titteli katoaaTechnology

Varoitus! Claude Code isänsä Boris Cherny sanoo: Kuukauden kuluttua Plan Modea ei enää käytetä, ohjelmistosuunnittelijan titteli katoaa

Varoitus! Claude Code isänsä Boris Cherny sanoo: Kuukauden kuluttua Plan Modea ei enää käytetä, ohjelmistosuunnittelijan...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026 Top 10 AI Agentit: Ydinmyyntipisteiden analyysiTechnology

2026 Top 10 AI Agentit: Ydinmyyntipisteiden analyysi

2026 Top 10 AI Agentit: Ydinmyyntipisteiden analyysi Johdanto Nopean tekoälyn kehityksen myötä AI agentit ovat nousseet ...

2026 vuoden Top 10 AI-työkalusuositukset: Vapauta tekoälyn todellinen potentiaaliTechnology

2026 vuoden Top 10 AI-työkalusuositukset: Vapauta tekoälyn todellinen potentiaali

2026 vuoden Top 10 AI-työkalusuositukset: Vapauta tekoälyn todellinen potentiaali Nykyään, kun teknologia kehittyy nopea...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 在快速发展的云计算领域,Amazon Web Services (AWS) 一直是领军者,提供丰富的服务和工具,帮助开发者、企业和技术专家在云上有效工作。以下是2026年值得关注的十大AWS工...