Google Deep Think-ийг нууцаар шинэчилж, ARC-AGI-2 шууд 84.6%-д хүрлээ

2/14/2026
1 min read

Google Deep Think-ийг нууцаар шинэчилж, ARC-AGI-2 шууд 84.6%-д хүрлээ\n\nСаяхан Google DeepMind Gemini 3-ын зориулалтын дүгнэлт гаргах горим Deep Think-ийг шинэчилсэн бөгөөд онооны үзүүлэлтээр шууд тэргүүлж эхэллээ.\n\nDeep Think\n\nARC-AGI-2 бол одоогоор AI-ийн дүгнэлт гаргах чадварыг шалгах тэргүүлэх жишиг гэж үздэг бөгөөд өмнө нь ямар ч загвар үүн дээр онцгой сайн оноо авч чадаагүй.\n\n基准对比\n\nХарин шинэчлэгдсэн Deep Think 84.6%-ийг авсан бөгөөд харьцуулбал: Claude Opus 4.6 нь 68.8%, GPT-5.2 нь 52.9%, бүр өөрийн Gemini 3 Pro Preview ч 31.1% байна.\n\nАхиц маш том байна.\n\n## Зөвхөн дүгнэлт гаргахаас гадна\n\nDeep Think-ийн хүсэл зөвхөн дүгнэлт гаргахаас илүү юм.\n\n不止推理\n\nHumanity's Last Exam буюу

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy засварын гарын авлага: Гялалзсан домогт амьтан хэрхэн авах вэ

Claude Code Buddy засварын гарын авлага: Гялалзсан домогт амьтан хэрхэн авах вэ 2026 оны 4-р сарын 1-нд, Anthropic Claud...

Obsidian Defuddle-г танилцууллаа, Obsidian Web Clipper-ийг шинэ түвшинд гаргалааTechnology

Obsidian Defuddle-г танилцууллаа, Obsidian Web Clipper-ийг шинэ түвшинд гаргалаа

Obsidian Defuddle-г танилцууллаа, Obsidian Web Clipper-ийг шинэ түвшинд гаргалаа Би Obsidian-ийн үндсэн санааг үргэлж и...

OpenAI гэнэт "Гурван нэг"-ийг зарлалаа: Браузер + Программчлал + ChatGPT нэгдэж, дотооддоо өнгөрсөн жил буруу замаар явсан гэдгээ хүлээн зөвшөөрчээTechnology

OpenAI гэнэт "Гурван нэг"-ийг зарлалаа: Браузер + Программчлал + ChatGPT нэгдэж, дотооддоо өнгөрсөн жил буруу замаар явсан гэдгээ хүлээн зөвшөөрчээ

OpenAI гэнэт зарлалаа "Гурван нэг"-ийг: Браузер + Программчлал + ChatGPT нэгдэж, дотооддоо өнгөрсөн жил буруу замаар явс...

2026, өөрийгөө "засаглах" гэж бүү шах! Энэ 8 жижиг зүйлийг сайн хий, эрүүл мэнд өөрөө ирнэHealth

2026, өөрийгөө "засаглах" гэж бүү шах! Энэ 8 жижиг зүйлийг сайн хий, эрүүл мэнд өөрөө ирнэ

2026, өөрийгөө "засаглах" гэж бүү шах! Энэ 8 жижиг зүйлийг сайн хий, эрүүл мэнд өөрөө ирнэ Шинэ жил эхэлж байна, өнгөрс...

Тэрээр жингээ хасахад хичээж байгаа ээжүүд, яагаад чадахгүй байна вэ?Health

Тэрээр жингээ хасахад хичээж байгаа ээжүүд, яагаад чадахгүй байна вэ?

Тэрээр жингээ хасахад хичээж байгаа ээжүүд, яагаад чадахгүй байна вэ? Гуравдугаар сар дунджаар өнгөрч, таны жингийн хас...

📝
Technology

AI Браузер 24 цагийн тогтвортой ажиллах гарын авлага

AI Браузер 24 цагийн тогтвортой ажиллах гарын авлага Энэхүү заавар нь тогтвортой, удаан хугацаанд ажиллах AI браузерын о...