گوگل نے خاموشی سے ڈیپ تھنک کو اپ گریڈ کیا، ARC-AGI-2 براہ راست 84.6% تک پہنچ گیا

2/14/2026
3 min read

گوگل نے خاموشی سے ڈیپ تھنک کو اپ گریڈ کیا، ARC-AGI-2 براہ راست 84.6% تک پہنچ گیا

ابھی حال ہی میں، گوگل ڈیپ مائنڈ نے جیمنی 3 کے خصوصی استدلال موڈ ڈیپ تھنک کو اپ گریڈ کیا، اور اسکورنگ نے براہ راست تمام ریکارڈ توڑ دیے۔

Deep Think

واضح رہے کہ ARC-AGI-2 اس وقت AI کی استدلال کی صلاحیت کو جانچنے کا سب سے جدید معیار سمجھا جاتا ہے، اور اس سے پہلے کوئی بھی ماڈل اس پر خاص طور پر اچھے نمبر حاصل نہیں کر سکا تھا۔

بنیادی موازنہ

جبکہ اپ گریڈ کے بعد ڈیپ تھنک نے 84.6% حاصل کیا، اس کا موازنہ کریں: Claude Opus 4.6 کا 68.8%، GPT-5.2 کا 52.9%، اور خود جیمنی 3 پرو پریویو کا بھی صرف 31.1% تھا۔

بہت بڑی بہتری۔

صرف استدلال نہیں

ڈیپ تھنک کی خواہشات واضح طور پر صرف استدلال تک محدود نہیں ہیں۔

صرف استدلال نہیں

Humanity's Last Exam نامی معیار پر، جسے "انسانیت کا آخری امتحان" کہا جاتا ہے، ڈیپ تھنک نے 48.4% حاصل کیا، یہ ٹیسٹ ریاضی، سائنس اور انجینئرنگ کے مشکل ترین سوالات کا احاطہ کرتا ہے۔ Claude Opus 4.6 نے 40.0% اور GPT-5.2 نے 34.5% حاصل کیا۔

پروگرامنگ کے لحاظ سے بھی بہت زبردست ہے:

Codeforces پر ڈیپ تھنک Elo 3455 تک پہنچ گیا، جبکہ جیمنی 3 پرو پریویو 2512 اور Claude Opus 4.6 2352 تھا۔

Codeforces

اس کے علاوہ ملٹی ماڈل فہم اور استدلال کے MMMU-Pro معیار پر، ڈیپ تھنک 81.5% کے ساتھ سب سے آگے ہے، لیکن یہاں مختلف کمپنیوں کے درمیان فرق اتنا بڑا نہیں ہے: جیمنی 3 پرو پریویو 81.0%، GPT-5.2 79.5%، Claude Opus 4.6 73.9%۔

MMMU-Pro

اسکورنگ کے علاوہ، ڈیپ تھنک نے 2025 کے فزکس اور کیمسٹری اولمپیاڈ کے تحریری حصے میں گولڈ میڈل کی سطح کا اسکور بھی حاصل کیا۔

سائنسی مسائل حل کرنا

گوگل ڈیپ مائنڈ نے اس بار خاص طور پر اس بات پر زور دیا کہ اپ گریڈ کے بعد ڈیپ تھنک اب صرف سوالات حل کرنے والی مشین نہیں ہے، بلکہ حقیقی دنیا کے سائنس اور انجینئرنگ کے مسائل کو حل کرنے کے لیے ہے۔

سائنسی مسائل

انہوں نے ڈیوک یونیورسٹی کی وانگ لیب کا کیس پیش کیا: محققین ڈیپ تھنک کو نئے سیمی کنڈکٹر مواد ڈیزائن کرنے اور پیچیدہ کرسٹل کی نشوونما کے عمل کو بہتر بنانے کے لیے استعمال کر رہے ہیں، یہ کرسٹل اعلی درجہ حرارت والے سیمی کنڈکٹرز کے امیدوار ہیں۔

ڈیوک کیس

مکینیکل انجینئرنگ

اس کے علاوہ مکینیکل انجینئرنگ کے شعبے کے محققین اسے فزیکل پروٹوٹائپ کو دہرانے کے لیے استعمال کر رہے ہیں، جس سے ہارڈ ویئر کی تکرار سافٹ ویئر کی تکرار کی رفتار تک پہنچ گئی ہے، جس کا مطلب معاون آلات وغیرہ کے شعبوں میں تیزی سے بہتری کا دورانیہ ہے۔

کیسے استعمال کریں

اپ گریڈ شدہ ڈیپ تھنک موڈ اب جیمنی ایپ میں گوگل AI الٹرا سبسکرپشن صارفین کے لیے شروع ہو گیا ہے۔

کیسے استعمال کریں

محققین اور ڈویلپرز کے لیے، گوگل نے Vertex AI ابتدائی رسائی پروگرام کھول دیا ہے، جسے API کے ذریعے استعمال کیا جا سکتا ہے۔

Vertex AI ابتدائی رسائی: https://goo.gle/4rMHUlq

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy ترمیم گائیڈ: چمکدار لیجنڈری پالتو جانور کیسے حاصل کریں

Claude Code Buddy ترمیم گائیڈ: چمکدار لیجنڈری پالتو جانور کیسے حاصل کریں 2026年4月1日،Anthropic 在 Claude Code 2.1.89 版本中悄然上...

Obsidian نے Defuddle متعارف کرایا، Obsidian Web Clipper کو ایک نئے عروج پر لے گیاTechnology

Obsidian نے Defuddle متعارف کرایا، Obsidian Web Clipper کو ایک نئے عروج پر لے گیا

Obsidian نے Defuddle متعارف کرایا، Obsidian Web Clipper کو ایک نئے عروج پر لے گیا میں ہمیشہ Obsidian کے بنیادی نظریے کو...

OpenAI اچانک اعلان کرتا ہے "تین میں ایک": براؤزر + پروگرامنگ + ChatGPT کا انضمام، اندرونی طور پر تسلیم کیا کہ پچھلے سال غلط راستہ اختیار کیا گیاTechnology

OpenAI اچانک اعلان کرتا ہے "تین میں ایک": براؤزر + پروگرامنگ + ChatGPT کا انضمام، اندرونی طور پر تسلیم کیا کہ پچھلے سال غلط راستہ اختیار کیا گیا

OpenAI اچانک اعلان کرتا ہے "تین میں ایک": براؤزر + پروگرامنگ + ChatGPT کا انضمام، اندرونی طور پر تسلیم کیا کہ پچھلے سال ...

2026، خود کو "خود نظم" کرنے پر مجبور نہ کریں! یہ 8 چھوٹے کام کریں، صحت خود بخود آئے گیHealth

2026، خود کو "خود نظم" کرنے پر مجبور نہ کریں! یہ 8 چھوٹے کام کریں، صحت خود بخود آئے گی

2026، خود کو "خود نظم" کرنے پر مجبور نہ کریں! یہ 8 چھوٹے کام کریں، صحت خود بخود آئے گی نیا سال شروع ہو چکا ہے، کیا آپ ن...

وہ مائیں جو وزن کم کرنے کی کوشش کر رہی ہیں لیکن کامیاب نہیں ہو پا رہی ہیں، یقیناً یہاں پھنس گئی ہیںHealth

وہ مائیں جو وزن کم کرنے کی کوشش کر رہی ہیں لیکن کامیاب نہیں ہو پا رہی ہیں، یقیناً یہاں پھنس گئی ہیں

وہ مائیں جو وزن کم کرنے کی کوشش کر رہی ہیں لیکن کامیاب نہیں ہو پا رہی ہیں، یقیناً یہاں پھنس گئی ہیں مارچ کا نصف گزر چکا...

📝
Technology

AI Browser 24 گھنٹے مستحکم چلانے کی رہنمائی

AI Browser 24 گھنٹے مستحکم چلانے کی رہنمائی یہ سبق مستحکم، طویل مدتی AI براؤزر ماحول قائم کرنے کا طریقہ بیان کرتا ہے۔ مو...