Google ने चुपचाप Deep Think को अपग्रेड किया, ARC-AGI-2 सीधे 84.6% तक पहुंचा

2/14/2026
3 min read

Google ने चुपचाप Deep Think को अपग्रेड किया, ARC-AGI-2 सीधे 84.6% तक पहुंचा

अभी-अभी, Google DeepMind ने Gemini 3 के विशेष अनुमान मोड Deep Think को अपग्रेड किया, और स्कोर सीधे चार्ट में सबसे ऊपर पहुंच गया।

Deep Think

यह जानना ज़रूरी है कि ARC-AGI-2 वर्तमान में AI की अनुमान क्षमता का परीक्षण करने के लिए एक अग्रणी बेंचमार्क के रूप में मान्यता प्राप्त है, और पहले कोई भी मॉडल इस पर विशेष रूप से अच्छे अंक प्राप्त नहीं कर सका।

बेंचमार्क तुलना

और अपग्रेड किए गए Deep Think ने 84.6% हासिल किया, तुलना करें: Claude Opus 4.6 68.8% है, GPT-5.2 52.9% है, और यहां तक कि Gemini 3 Pro Preview भी केवल 31.1% है।

बहुत बड़ा सुधार।

केवल अनुमान से अधिक

Deep Think की महत्वाकांक्षा स्पष्ट रूप से केवल अनुमान तक ही सीमित नहीं है।

केवल अनुमान से अधिक

Humanity's Last Exam नामक बेंचमार्क पर, जिसे "मानवता की अंतिम परीक्षा" कहा जाता है, Deep Think ने 48.4% हासिल किया, यह परीक्षण गणित, विज्ञान और इंजीनियरिंग के सबसे कठिन प्रश्नों को कवर करता है। Claude Opus 4.6 ने 40.0% और GPT-5.2 ने 34.5% अंक प्राप्त किए।

प्रोग्रामिंग के मामले में भी यह बहुत शक्तिशाली है:

Codeforces पर Deep Think Elo 3455 तक पहुंच गया, जबकि Gemini 3 Pro Preview 2512 और Claude Opus 4.6 2352 था।

Codeforces

इसके अलावा, मल्टीमॉडल समझ और अनुमान के MMMU-Pro बेंचमार्क पर, Deep Think 81.5% के साथ सबसे आगे है, लेकिन यहां विभिन्न कंपनियों के बीच अंतर इतना बड़ा नहीं है: Gemini 3 Pro Preview 81.0%, GPT-5.2 79.5%, Claude Opus 4.6 73.9%।

MMMU-Pro

स्कोर के अलावा, Deep Think ने 2025 भौतिकी और रसायन विज्ञान ओलंपियाड की लिखित परीक्षा में स्वर्ण पदक स्तर का स्कोर भी हासिल किया।

वैज्ञानिक समस्याओं को हल करना है

Google DeepMind ने इस बार विशेष रूप से जोर दिया कि अपग्रेड किया गया Deep Think अब केवल एक समस्या-समाधान मशीन नहीं है, बल्कि वास्तविक दुनिया की वैज्ञानिक और इंजीनियरिंग समस्याओं को हल करने के लिए है

वैज्ञानिक समस्या

उन्होंने ड्यूक विश्वविद्यालय की वांग लैब का एक मामला दिखाया: शोधकर्ताओं ने नई अर्धचालक सामग्री डिजाइन करने, जटिल क्रिस्टल की विकास प्रक्रिया को अनुकूलित करने के लिए Deep Think का उपयोग किया, ये क्रिस्टल उच्च तापमान अर्धचालकों के लिए उम्मीदवार सामग्री हैं।

ड्यूक मामला

यांत्रिक इंजीनियरिंग

यांत्रिक इंजीनियरिंग के क्षेत्र में शोधकर्ताओं ने भौतिक प्रोटोटाइप को दोहराने के लिए इसका उपयोग किया, जिससे हार्डवेयर पुनरावृत्ति सॉफ्टवेयर पुनरावृत्ति की गति तक पहुंच गई, जिसका अर्थ सहायक उपकरणों जैसे क्षेत्रों में तेजी से सुधार चक्र है।

कैसे उपयोग करें

अपग्रेड किया गया Deep Think मोड अब Gemini App में Google AI Ultra सदस्यता वाले उपयोगकर्ताओं के लिए रोल आउट होना शुरू हो गया है।

कैसे उपयोग करें

शोधकर्ताओं और डेवलपर्स के लिए, Google ने Vertex AI प्रारंभिक एक्सेस प्रोग्राम खोला है, जिसका उपयोग API के माध्यम से किया जा सकता है।

Vertex AI प्रारंभिक एक्सेस: https://goo.gle/4rMHUlq

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy संशोधन गाइड: कैसे प्राप्त करें चमकदार किंवदंती स्तर का पालतू

Claude Code Buddy संशोधन गाइड: कैसे प्राप्त करें चमकदार किंवदंती स्तर का पालतू 2026年4月1日,Anthropic 在 Claude Code 2.1.89 ...

Obsidian ने Defuddle लॉन्च किया, Obsidian Web Clipper को एक नए स्तर पर ले गयाTechnology

Obsidian ने Defuddle लॉन्च किया, Obsidian Web Clipper को एक नए स्तर पर ले गया

Obsidian ने Defuddle लॉन्च किया, Obsidian Web Clipper को एक नए स्तर पर ले गया मैं हमेशा Obsidian के मूल विचार को पसंद क...

OpenAI अचानक घोषणा करता है "तीन-इन-एक": ब्राउज़र + प्रोग्रामिंग + ChatGPT का विलय, आंतरिक रूप से स्वीकार किया कि पिछले वर्ष गलत दिशा में बढ़ाTechnology

OpenAI अचानक घोषणा करता है "तीन-इन-एक": ब्राउज़र + प्रोग्रामिंग + ChatGPT का विलय, आंतरिक रूप से स्वीकार किया कि पिछले वर्ष गलत दिशा में बढ़ा

OpenAI अचानक घोषणा करता है "तीन-इन-एक": ब्राउज़र + प्रोग्रामिंग + ChatGPT का विलय, आंतरिक रूप से स्वीकार किया कि पिछले व...

2026, खुद को 'स्वायत्त' करने के लिए मजबूर नहीं! ये 8 छोटी बातें करें, स्वास्थ्य स्वाभाविक रूप से आएगाHealth

2026, खुद को 'स्वायत्त' करने के लिए मजबूर नहीं! ये 8 छोटी बातें करें, स्वास्थ्य स्वाभाविक रूप से आएगा

2026, खुद को 'स्वायत्त' करने के लिए मजबूर नहीं! ये 8 छोटी बातें करें, स्वास्थ्य स्वाभाविक रूप से आएगा नए साल की शुरुआत,...

वे माताएँ जो वजन कम करने की कोशिश कर रही हैं लेकिन सफल नहीं हो रही हैं, निश्चित रूप से यहाँ फंस गई हैंHealth

वे माताएँ जो वजन कम करने की कोशिश कर रही हैं लेकिन सफल नहीं हो रही हैं, निश्चित रूप से यहाँ फंस गई हैं

वे माताएँ जो वजन कम करने की कोशिश कर रही हैं लेकिन सफल नहीं हो रही हैं, निश्चित रूप से यहाँ फंस गई हैं मार्च का आधा मही...

📝
Technology

AI ब्राउज़र 24 घंटे स्थिर संचालन गाइड

AI ब्राउज़र 24 घंटे स्थिर संचालन गाइड यह ट्यूटोरियल एक स्थिर, दीर्घकालिक AI ब्राउज़र वातावरण स्थापित करने के तरीके को प्...