Google ने Deep Think मध्ये शांतपणे सुधारणा केली, ARC-AGI-2 थेट 84.6% पर्यंत पोहोचले
Google ने Deep Think मध्ये शांतपणे सुधारणा केली, ARC-AGI-2 थेट 84.6% पर्यंत पोहोचले
Google DeepMind ने नुकतेच Gemini 3 च्या Deep Think या खास अनुमान (reasoning) मोडमध्ये सुधारणा केली, आणि गुणवत्ता यादीत थेट अव्वल स्थान पटकावले.

हे लक्षात घ्या की, ARC-AGI-2 हे सध्या AI च्या अनुमान क्षमतेचे परीक्षण करण्यासाठीचे एक महत्त्वाचे मापदंड (benchmark) मानले जाते. यापूर्वी कोणत्याही मॉडेलला यावर विशेष चांगले गुण मिळाले नव्हते.

सुधारित Deep Think ने 84.6% गुण मिळवले, तुलनात्मकदृष्ट्या Claude Opus 4.6 ला 68.8%, GPT-5.2 ला 52.9% आणि Google च्या Gemini 3 Pro Preview ला फक्त 31.1% गुण मिळाले.
मोठी सुधारणा.
केवळ अनुमान नव्हे
Deep Think ची महत्वाकांक्षा केवळ अनुमानापुरती मर्यादित नाही.

Humanity's Last Exam या 'माणसाची अंतिम परीक्षा' म्हणून ओळखल्या जाणाऱ्या मापदंडावर Deep Think ने 48.4% गुण मिळवले. या परीक्षेत गणित, विज्ञान आणि अभियांत्रिकी क्षेत्रातील सर्वात कठीण प्रश्नांचा समावेश आहे. Claude Opus 4.6 ला 40.0% आणि GPT-5.2 ला 34.5% गुण मिळाले.
प्रोग्रामिंगमध्येही हे खूप प्रभावी आहे:
Codeforces वर Deep Think Elo 3455 पर्यंत पोहोचले, तर Gemini 3 Pro Preview 2512 आणि Claude Opus 4.6 2352 पर्यंतच पोहोचले.

याव्यतिरिक्त, मल्टीमॉडल आकलन (understanding) आणि MMMU-Pro च्या आधारावर Deep Think 81.5% गुणांसह आघाडीवर आहे, परंतु येथे इतर मॉडेल्समधील फरक तितका मोठा नाही: Gemini 3 Pro Preview 81.0%, GPT-5.2 79.5%, Claude Opus 4.6 73.9%.

गुणांव्यतिरिक्त, Deep Think ने 2025 च्या भौतिकशास्त्र आणि रसायनशास्त्र ऑलिम्पियाडच्या लेखी परीक्षेत सुवर्णपदकाच्या स्तरावरील गुण मिळवले.
वैज्ञानिक समस्या सोडवण्यावर भर
Google DeepMind ने या वेळी विशेष जोर देऊन सांगितले की, सुधारित Deep Think आता फक्त प्रश्न सोडवणारे मशीन नाही, तर ते वास्तविक जगातील विज्ञान आणि अभियांत्रिकी समस्या सोडवण्यावर लक्ष केंद्रित करेल.

त्यांनी ड्यूक विद्यापीठातील वांग प्रयोगशाळेचे उदाहरण दिले: संशोधकांनी Deep Think चा उपयोग नवीन अर्धवाहक (semiconductor) साहित्य (materials) तयार करण्यासाठी केला, तसेच जटिल स्फटिकांच्या वाढीच्या प्रक्रियेला अनुकूल (optimize) केले, हे स्फटिक उच्च-तापमान अर्धवाहकांचे संभाव्य उमेदवार आहेत.


याव्यतिरिक्त, यांत्रिक अभियांत्रिकी (mechanical engineering) क्षेत्रातील संशोधकांनी भौतिक प्रोटोटाइपमध्ये सुधारणा करण्यासाठी याचा वापर केला, ज्यामुळे हार्डवेअरच्या पुनरावृत्तीची गती सॉफ्टवेअरच्या गतीइतकी झाली. याचा अर्थ सहाय्यक उपकरणांसारख्या क्षेत्रांमध्ये जलद सुधारणा करता येतील.
कसे वापरावे
सुधारित Deep Think मोड आता Gemini App मध्ये Google AI Ultra च्या सदस्यांसाठी उपलब्ध आहे.

संशोधक आणि विकासकांसाठी, Google ने Vertex AI लवकर प्रवेश योजना सुरू केली आहे, ज्याद्वारे API वापरता येईल.
Vertex AI लवकर प्रवेश: https://goo.gle/4rMHUlq

