گوگل نے خاموشی سے ڈیپ تھنک کو اپ گریڈ کیا، ARC-AGI-2 براہ راست 84.6% تک پہنچ گیا
گوگل نے خاموشی سے ڈیپ تھنک کو اپ گریڈ کیا، ARC-AGI-2 براہ راست 84.6% تک پہنچ گیا
ابھی حال ہی میں، گوگل ڈیپ مائنڈ نے جیمنی 3 کے خصوصی استدلال موڈ ڈیپ تھنک کو اپ گریڈ کیا، اور اسکورنگ نے براہ راست تمام ریکارڈ توڑ دیے۔

واضح رہے کہ ARC-AGI-2 اس وقت AI کی استدلال کی صلاحیت کو جانچنے کا سب سے جدید معیار سمجھا جاتا ہے، اور اس سے پہلے کوئی بھی ماڈل اس پر خاص طور پر اچھے نمبر حاصل نہیں کر سکا تھا۔

جبکہ اپ گریڈ کے بعد ڈیپ تھنک نے 84.6% حاصل کیا، اس کا موازنہ کریں: Claude Opus 4.6 کا 68.8%، GPT-5.2 کا 52.9%، اور خود جیمنی 3 پرو پریویو کا بھی صرف 31.1% تھا۔
بہت بڑی بہتری۔
صرف استدلال نہیں
ڈیپ تھنک کی خواہشات واضح طور پر صرف استدلال تک محدود نہیں ہیں۔

Humanity's Last Exam نامی معیار پر، جسے "انسانیت کا آخری امتحان" کہا جاتا ہے، ڈیپ تھنک نے 48.4% حاصل کیا، یہ ٹیسٹ ریاضی، سائنس اور انجینئرنگ کے مشکل ترین سوالات کا احاطہ کرتا ہے۔ Claude Opus 4.6 نے 40.0% اور GPT-5.2 نے 34.5% حاصل کیا۔
پروگرامنگ کے لحاظ سے بھی بہت زبردست ہے:
Codeforces پر ڈیپ تھنک Elo 3455 تک پہنچ گیا، جبکہ جیمنی 3 پرو پریویو 2512 اور Claude Opus 4.6 2352 تھا۔

اس کے علاوہ ملٹی ماڈل فہم اور استدلال کے MMMU-Pro معیار پر، ڈیپ تھنک 81.5% کے ساتھ سب سے آگے ہے، لیکن یہاں مختلف کمپنیوں کے درمیان فرق اتنا بڑا نہیں ہے: جیمنی 3 پرو پریویو 81.0%، GPT-5.2 79.5%، Claude Opus 4.6 73.9%۔

اسکورنگ کے علاوہ، ڈیپ تھنک نے 2025 کے فزکس اور کیمسٹری اولمپیاڈ کے تحریری حصے میں گولڈ میڈل کی سطح کا اسکور بھی حاصل کیا۔
سائنسی مسائل حل کرنا
گوگل ڈیپ مائنڈ نے اس بار خاص طور پر اس بات پر زور دیا کہ اپ گریڈ کے بعد ڈیپ تھنک اب صرف سوالات حل کرنے والی مشین نہیں ہے، بلکہ حقیقی دنیا کے سائنس اور انجینئرنگ کے مسائل کو حل کرنے کے لیے ہے۔

انہوں نے ڈیوک یونیورسٹی کی وانگ لیب کا کیس پیش کیا: محققین ڈیپ تھنک کو نئے سیمی کنڈکٹر مواد ڈیزائن کرنے اور پیچیدہ کرسٹل کی نشوونما کے عمل کو بہتر بنانے کے لیے استعمال کر رہے ہیں، یہ کرسٹل اعلی درجہ حرارت والے سیمی کنڈکٹرز کے امیدوار ہیں۔


اس کے علاوہ مکینیکل انجینئرنگ کے شعبے کے محققین اسے فزیکل پروٹوٹائپ کو دہرانے کے لیے استعمال کر رہے ہیں، جس سے ہارڈ ویئر کی تکرار سافٹ ویئر کی تکرار کی رفتار تک پہنچ گئی ہے، جس کا مطلب معاون آلات وغیرہ کے شعبوں میں تیزی سے بہتری کا دورانیہ ہے۔
کیسے استعمال کریں
اپ گریڈ شدہ ڈیپ تھنک موڈ اب جیمنی ایپ میں گوگل AI الٹرا سبسکرپشن صارفین کے لیے شروع ہو گیا ہے۔

محققین اور ڈویلپرز کے لیے، گوگل نے Vertex AI ابتدائی رسائی پروگرام کھول دیا ہے، جسے API کے ذریعے استعمال کیا جا سکتا ہے۔
Vertex AI ابتدائی رسائی: https://goo.gle/4rMHUlq





