Google-მა ჩუმად განაახლა Deep Think, ARC-AGI-2-მა პირდაპირ 84.6%-მდე აიწია

2/14/2026
2 min read

Google-მა ჩუმად განაახლა Deep Think, ARC-AGI-2-მა პირდაპირ 84.6%-მდე აიწია

ახლახან, Google DeepMind-მა განაახლა Gemini 3-ის სპეციალური მსჯელობის რეჟიმი Deep Think, ქულებმა პირდაპირ გაანადგურა ლიდერბორდი.

Deep Think

უნდა იცოდეთ, რომ ARC-AGI-2 ამჟამად აღიარებულია, როგორც AI-ის მსჯელობის უნარის ტესტირების წინა ხაზის სტანდარტი, აქამდე ვერცერთმა მოდელმა ვერ მიიღო მასზე განსაკუთრებით კარგი ქულები.

ბაზისური შედარება

განახლებულმა Deep Think-მა 84.6% აიღო, შედარებისთვის: Claude Opus 4.6 არის 68.8%, GPT-5.2 არის 52.9%, თვით Gemini 3 Pro Preview-იც კი მხოლოდ 31.1%-ია.

უზარმაზარი გაუმჯობესებაა.

არა მხოლოდ მსჯელობა

Deep Think-ის ამბიციები აშკარად სცილდება მსჯელობას.

არა მხოლოდ მსჯელობა

Humanity's Last Exam-ის სტანდარტზე, რომელსაც „კაცობრიობის ბოლო გამოცდას“ უწოდებენ, Deep Think-მა 48.4% აიღო, ეს ტესტი მოიცავს მათემატიკის, მეცნიერებისა და საინჟინრო სფეროების ყველაზე რთულ საკითხებს. Claude Opus 4.6-მა 40.0% მიიღო, GPT-5.2-მა კი 34.5%.

პროგრამირების მხრივაც ძალიან მაგარია:

Codeforces-ზე Deep Think-მა მიაღწია Elo 3455-ს, ხოლო Gemini 3 Pro Preview-მ 2512-ს, Claude Opus 4.6-მა კი 2352-ს.

Codeforces

გარდა ამისა, მრავალმოდალური გაგებისა და მსჯელობის MMMU-Pro სტანდარტზე, Deep Think ასევე ლიდერობს 81.5%-ით, თუმცა აქ სხვაობა არც ისე დიდია: Gemini 3 Pro Preview 81.0%, GPT-5.2 79.5%, Claude Opus 4.6 73.9%.

MMMU-Pro

ქულების გარდა, Deep Think-მა ასევე მიიღო ოქროს მედლის დონის შედეგი 2025 წლის ფიზიკისა და ქიმიის ოლიმპიადების წერილობით ნაწილში.

მეცნიერული პრობლემების გადასაჭრელად

Google DeepMind-მა ამჯერად განსაკუთრებით ხაზი გაუსვა, რომ განახლებული Deep Think უბრალოდ პრობლემების გადამჭრელი მანქანა აღარ არის, არამედ რეალური სამყაროს მეცნიერული და საინჟინრო პრობლემების გადაჭრა სურს.

მეცნიერული პრობლემები

მათ წარმოადგინეს Duke University Wang Lab-ის მაგალითი: მკვლევარები იყენებენ Deep Think-ს ახალი ტიპის ნახევარგამტარი მასალების შესაქმნელად, რთული კრისტალების ზრდის პროცესის ოპტიმიზაციისთვის, ეს კრისტალები მაღალი ტემპერატურის ნახევარგამტარების კანდიდატი მასალებია.

Duke მაგალითი

მექანიკური ინჟინერია

ასევე, მექანიკური ინჟინერიის სფეროს მკვლევარები იყენებენ მას ფიზიკური პროტოტიპების გასამეორებლად, რაც აპარატურის გამეორებას პროგრამული უზრუნველყოფის გამეორების სიჩქარესთან აახლოებს, რაც დამხმარე მოწყობილობების და სხვა სფეროებში გაუმჯობესების უფრო სწრაფ ციკლს ნიშნავს.

როგორ გამოვიყენოთ

განახლებული Deep Think რეჟიმი ახლა უკვე იწყებს Google AI Ultra-ს აბონენტებისთვის Gemini App-ში გაგზავნას.

როგორ გამოვიყენოთ

მკვლევარებისა და დეველოპერებისთვის Google-მა გახსნა Vertex AI-ზე ადრეული წვდომის პროგრამა, რომლის გამოყენებაც API-ის საშუალებით არის შესაძლებელი.

Vertex AI-ზე ადრეული წვდომა: https://goo.gle/4rMHUlq

Published in Technology

You Might Also Like

როგორ გამოვიყენოთ ღრუბლოვანი კომპიუტერული ტექნოლოგიები: შექმენით თქვენი პირველი ღრუბლოვანი ინფრასტრუქტურის სრული სახელმძღვანელოTechnology

როგორ გამოვიყენოთ ღრუბლოვანი კომპიუტერული ტექნოლოგიები: შექმენით თქვენი პირველი ღრუბლოვანი ინფრასტრუქტურის სრული სახელმძღვანელო

[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLD...

გაფრთხილება! Claude Code-ის მამა პირდაპირ ამბობს: 1 თვის შემდეგ Plan Mode-ის გამოყენება აღარ იქნება საჭირო, პროგრამული ინჟინრების ტიტული გაქრებაTechnology

გაფრთხილება! Claude Code-ის მამა პირდაპირ ამბობს: 1 თვის შემდეგ Plan Mode-ის გამოყენება აღარ იქნება საჭირო, პროგრამული ინჟინრების ტიტული გაქრება

გაფრთხილება! Claude Code-ის მამა პირდაპირ ამბობს: 1 თვის შემდეგ Plan Mode-ის გამოყენება აღარ იქნება საჭირო, პროგრამული ი...

2026 წლის 10 საუკეთესო ღრმა სწავლების რესურსებიTechnology

2026 წლის 10 საუკეთესო ღრმა სწავლების რესურსები

2026 წლის 10 საუკეთესო ღრმა სწავლების რესურსები ღრმა სწავლების სწრაფი განვითარებით სხვადასხვა სფეროში, სულ უფრო მეტი სას...

2026 წლის 10 საუკეთესო AI აგენტი: ძირითადი მახასიათებლების ანალიზიTechnology

2026 წლის 10 საუკეთესო AI აგენტი: ძირითადი მახასიათებლების ანალიზი

2026 წლის 10 საუკეთესო AI აგენტი: ძირითადი მახასიათებლების ანალიზი შესავალი ხელოვნური ინტელიგენციის სწრაფი განვითარების ...

2026 წლის 10 საუკეთესო AI ინსტრუმენტი: ხელოვნური ინტელექტის რეალური პოტენციალის გათავისუფლებაTechnology

2026 წლის 10 საუკეთესო AI ინსტრუმენტი: ხელოვნური ინტელექტის რეალური პოტენციალის გათავისუფლება

2026 წლის 10 საუკეთესო AI ინსტრუმენტი: ხელოვნური ინტელექტის რეალური პოტენციალის გათავისუფლება დღეს ტექნოლოგიის სწრაფი გა...

2026 წლის საუკეთესო 10 AWS ინსტრუმენტი და რესურსიTechnology

2026 წლის საუკეთესო 10 AWS ინსტრუმენტი და რესურსი

2026 წლის საუკეთესო 10 AWS ინსტრუმენტი და რესურსი ბრიტანული სწრაფად განვითარებადი ღრუბლოვანი კომპიუტინგის სფეროში, Amazo...