Google ने Deep Think मध्ये शांतपणे सुधारणा केली, ARC-AGI-2 थेट 84.6% पर्यंत पोहोचले

2/14/2026
2 min read

Google ने Deep Think मध्ये शांतपणे सुधारणा केली, ARC-AGI-2 थेट 84.6% पर्यंत पोहोचले

Google DeepMind ने नुकतेच Gemini 3 च्या Deep Think या खास अनुमान (reasoning) मोडमध्ये सुधारणा केली, आणि गुणवत्ता यादीत थेट अव्वल स्थान पटकावले.

Deep Think

हे लक्षात घ्या की, ARC-AGI-2 हे सध्या AI च्या अनुमान क्षमतेचे परीक्षण करण्यासाठीचे एक महत्त्वाचे मापदंड (benchmark) मानले जाते. यापूर्वी कोणत्याही मॉडेलला यावर विशेष चांगले गुण मिळाले नव्हते.

基准对比

सुधारित Deep Think ने 84.6% गुण मिळवले, तुलनात्मकदृष्ट्या Claude Opus 4.6 ला 68.8%, GPT-5.2 ला 52.9% आणि Google च्या Gemini 3 Pro Preview ला फक्त 31.1% गुण मिळाले.

मोठी सुधारणा.

केवळ अनुमान नव्हे

Deep Think ची महत्वाकांक्षा केवळ अनुमानापुरती मर्यादित नाही.

不止推理

Humanity's Last Exam या 'माणसाची अंतिम परीक्षा' म्हणून ओळखल्या जाणाऱ्या मापदंडावर Deep Think ने 48.4% गुण मिळवले. या परीक्षेत गणित, विज्ञान आणि अभियांत्रिकी क्षेत्रातील सर्वात कठीण प्रश्नांचा समावेश आहे. Claude Opus 4.6 ला 40.0% आणि GPT-5.2 ला 34.5% गुण मिळाले.

प्रोग्रामिंगमध्येही हे खूप प्रभावी आहे:

Codeforces वर Deep Think Elo 3455 पर्यंत पोहोचले, तर Gemini 3 Pro Preview 2512 आणि Claude Opus 4.6 2352 पर्यंतच पोहोचले.

Codeforces

याव्यतिरिक्त, मल्टीमॉडल आकलन (understanding) आणि MMMU-Pro च्या आधारावर Deep Think 81.5% गुणांसह आघाडीवर आहे, परंतु येथे इतर मॉडेल्समधील फरक तितका मोठा नाही: Gemini 3 Pro Preview 81.0%, GPT-5.2 79.5%, Claude Opus 4.6 73.9%.

MMMU-Pro

गुणांव्यतिरिक्त, Deep Think ने 2025 च्या भौतिकशास्त्र आणि रसायनशास्त्र ऑलिम्पियाडच्या लेखी परीक्षेत सुवर्णपदकाच्या स्तरावरील गुण मिळवले.

वैज्ञानिक समस्या सोडवण्यावर भर

Google DeepMind ने या वेळी विशेष जोर देऊन सांगितले की, सुधारित Deep Think आता फक्त प्रश्न सोडवणारे मशीन नाही, तर ते वास्तविक जगातील विज्ञान आणि अभियांत्रिकी समस्या सोडवण्यावर लक्ष केंद्रित करेल.

科学问题

त्यांनी ड्यूक विद्यापीठातील वांग प्रयोगशाळेचे उदाहरण दिले: संशोधकांनी Deep Think चा उपयोग नवीन अर्धवाहक (semiconductor) साहित्य (materials) तयार करण्यासाठी केला, तसेच जटिल स्फटिकांच्या वाढीच्या प्रक्रियेला अनुकूल (optimize) केले, हे स्फटिक उच्च-तापमान अर्धवाहकांचे संभाव्य उमेदवार आहेत.

Duke案例

机械工程

याव्यतिरिक्त, यांत्रिक अभियांत्रिकी (mechanical engineering) क्षेत्रातील संशोधकांनी भौतिक प्रोटोटाइपमध्ये सुधारणा करण्यासाठी याचा वापर केला, ज्यामुळे हार्डवेअरच्या पुनरावृत्तीची गती सॉफ्टवेअरच्या गतीइतकी झाली. याचा अर्थ सहाय्यक उपकरणांसारख्या क्षेत्रांमध्ये जलद सुधारणा करता येतील.

कसे वापरावे

सुधारित Deep Think मोड आता Gemini App मध्ये Google AI Ultra च्या सदस्यांसाठी उपलब्ध आहे.

如何使用

संशोधक आणि विकासकांसाठी, Google ने Vertex AI लवकर प्रवेश योजना सुरू केली आहे, ज्याद्वारे API वापरता येईल.

Vertex AI लवकर प्रवेश: https://goo.gle/4rMHUlq

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy सुधारणा मार्गदर्शक: कसे मिळवायचे चमकदार किंवदंती स्तराचे पाळीव प्राणी

Claude Code Buddy सुधारणा मार्गदर्शक: कसे मिळवायचे चमकदार किंवदंती स्तराचे पाळीव प्राणी 2026年4月1日,Anthropic 在 Claude Cod...

Obsidian ने Defuddle लॉन्च केला, Obsidian Web Clipper ला एक नवीन उंचीवर नेलेTechnology

Obsidian ने Defuddle लॉन्च केला, Obsidian Web Clipper ला एक नवीन उंचीवर नेले

Obsidian ने Defuddle लॉन्च केला, Obsidian Web Clipper ला एक नवीन उंचीवर नेले मी नेहमीच Obsidian च्या मुख्य तत्त्वांवर प...

OpenAI अचानक 'तीन-एक' ची घोषणा करते: ब्राउझर + प्रोग्रामिंग + ChatGPT एकत्रित, आतमध्ये मान्य केले की गेल्या वर्षी चुकीचा मार्ग घेतलाTechnology

OpenAI अचानक 'तीन-एक' ची घोषणा करते: ब्राउझर + प्रोग्रामिंग + ChatGPT एकत्रित, आतमध्ये मान्य केले की गेल्या वर्षी चुकीचा मार्ग घेतला

OpenAI अचानक 'तीन-एक' ची घोषणा करते: ब्राउझर + प्रोग्रामिंग + ChatGPT एकत्रित, आतमध्ये मान्य केले की गेल्या वर्षी चुकीचा...

2026, स्वतःला 'आत्मशिस्त' देण्याची गरज नाही! या 8 लहान गोष्टी करा, आरोग्य आपोआप येईलHealth

2026, स्वतःला 'आत्मशिस्त' देण्याची गरज नाही! या 8 लहान गोष्टी करा, आरोग्य आपोआप येईल

2026, स्वतःला 'आत्मशिस्त' देण्याची गरज नाही! या 8 लहान गोष्टी करा, आरोग्य आपोआप येईल नवीन वर्षाची सुरुवात झाली आहे, गेल...

त्या मेहनतीने वजन कमी करण्याचा प्रयत्न करणाऱ्या मातांना, नक्कीच इथेच अडचण येतेHealth

त्या मेहनतीने वजन कमी करण्याचा प्रयत्न करणाऱ्या मातांना, नक्कीच इथेच अडचण येते

त्या मेहनतीने वजन कमी करण्याचा प्रयत्न करणाऱ्या मातांना, नक्कीच इथेच अडचण येते मार्चचा मध्य गेला आहे, तुमचा वजन कमी करण...

📝
Technology

AI ब्राउझर 24 तास स्थिर चालवण्याची मार्गदर्शिका

AI ब्राउझर 24 तास स्थिर चालवण्याची मार्गदर्शिका या ट्यूटोरियलमध्ये स्थिर, दीर्घकालीन AI ब्राउझर वातावरण कसे तयार करावे ह...