গুগল নীরবে ডিপ থিঙ্ক আপডেট করেছে, ARC-AGI-2 সরাসরি ৮৪.৬%-এ পৌঁছেছে

2/14/2026
2 min read

গুগল নীরবে ডিপ থিঙ্ক আপডেট করেছে, ARC-AGI-2 সরাসরি ৮৪.৬%-এ পৌঁছেছে

এইমাত্র, Google DeepMind জেমিনি ৩-এর ডেডিকেটেড রিজনিং মোড ডিপ থিঙ্ক আপডেট করেছে, এবং স্কোরিং সরাসরি শীর্ষে চলে গেছে।

ডিপ থিঙ্ক

জানতে হবে, ARC-AGI-2 বর্তমানে AI-এর রিজনিং ক্ষমতা পরীক্ষার জন্য একটি অগ্রণী বেঞ্চমার্ক হিসেবে স্বীকৃত, আগে কোনো মডেল এতে বিশেষভাবে ভালো স্কোর করতে পারেনি।

বেঞ্চমার্ক তুলনা

আপডেট করার পরে ডিপ থিঙ্ক ৮৪.৬% স্কোর করেছে, তুলনা করলে: Claude Opus 4.6-এর স্কোর ৬৮.৮%, GPT-5.2-এর ৫২.৯%, এমনকি তাদের নিজস্ব জেমিনি ৩ প্রো প্রিভিউ-এর স্কোরও মাত্র ৩১.১%।

বিশাল উন্নতি।

শুধুমাত্র রিজনিং নয়

ডিপ থিঙ্কের উচ্চাকাঙ্ক্ষা স্পষ্টতই শুধুমাত্র রিজনিং-এর মধ্যে সীমাবদ্ধ নয়।

শুধুমাত্র রিজনিং নয়

Humanity's Last Exam নামক বেঞ্চমার্কে, যা "মানবতার শেষ পরীক্ষা" নামে পরিচিত, ডিপ থিঙ্ক ৪৮.৪% স্কোর করেছে, এই পরীক্ষাটি গণিত, বিজ্ঞান এবং প্রকৌশল ক্ষেত্রের কঠিনতম সমস্যাগুলি কভার করে। Claude Opus 4.6-এর স্কোর ৪০.০%, GPT-5.2-এর ৩৪.৫%।

প্রোগ্রামিংয়ের ক্ষেত্রেও এটি খুব শক্তিশালী:

Codeforces-এ ডিপ থিঙ্ক Elo ৩4৫৫-এ পৌঁছেছে, যেখানে জেমিনি ৩ প্রো প্রিভিউ-এর ২৫১২ এবং Claude Opus 4.6-এর ২৩৫২।

Codeforces

এছাড়াও, মাল্টিমোডাল আন্ডারস্ট্যান্ডিং এবং রিজনিং-এর MMMU-Pro বেঞ্চমার্কে, ডিপ থিঙ্ক ৮১.৫% নিয়ে এগিয়ে আছে, তবে এখানে অন্যান্য মডেলগুলোর মধ্যে পার্থক্য তেমন বেশি নয়: জেমিনি ৩ প্রো প্রিভিউ ৮১.০%, GPT-5.2 ৭৯.৫%, Claude Opus 4.6 ৭৩.৯%।

MMMU-Pro

স্কোরিং ছাড়াও, ডিপ থিঙ্ক ২০২৫ সালের পদার্থবিদ্যা এবং রসায়ন অলিম্পিয়াডের লিখিত অংশে স্বর্ণপদক স্তরের ফলাফল অর্জন করেছে।

বিজ্ঞান বিষয়ক সমস্যা সমাধান করতে হবে

Google DeepMind এইবার বিশেষভাবে জোর দিয়েছে যে, আপডেট করা ডিপ থিঙ্ক আর শুধুমাত্র সমস্যা সমাধানের মেশিন নয়, বরং বাস্তব বিশ্বের বিজ্ঞান এবং প্রকৌশল সমস্যাগুলি সমাধান করবে

বিজ্ঞান বিষয়ক সমস্যা

তারা ডিউক ইউনিভার্সিটির ওয়াং ল্যাবের একটি উদাহরণ দেখিয়েছে: গবেষকরা নতুন সেমিকন্ডাক্টর উপাদান ডিজাইন করতে, জটিল স্ফটিকের বৃদ্ধি প্রক্রিয়া অপ্টিমাইজ করতে ডিপ থিঙ্ক ব্যবহার করছেন, এই স্ফটিকগুলি উচ্চ-তাপমাত্রার সেমিকন্ডাক্টরের জন্য সম্ভাব্য উপাদান।

ডিউক উদাহরণ

যন্ত্র প্রকৌশল

এছাড়াও, যন্ত্র প্রকৌশল ক্ষেত্রের গবেষকরা এটিকে ফিজিক্যাল প্রোটোটাইপ পুনরাবৃত্তি করতে ব্যবহার করছেন, যা হার্ডওয়্যার পুনরাবৃত্তিকে সফটওয়্যার পুনরাবৃত্তির গতিতে পৌঁছে দিয়েছে, সহায়ক ডিভাইস ইত্যাদি ক্ষেত্রে এর অর্থ হল দ্রুত উন্নতির চক্র।

কিভাবে ব্যবহার করবেন

আপডেট করা ডিপ থিঙ্ক মোডটি এখন জেমিনি অ্যাপে Google AI Ultra সাবস্ক্রিপশন ব্যবহারকারীদের জন্য রোল আউট করা শুরু হয়েছে।

কিভাবে ব্যবহার করবেন

গবেষক এবং ডেভেলপারদের জন্য, Google Vertex AI আর্লি অ্যাক্সেস প্রোগ্রাম উন্মুক্ত করেছে, যা API-এর মাধ্যমে ব্যবহার করা যেতে পারে।

Vertex AI আর্লি অ্যাক্সেস: https://goo.gle/4rMHUlq

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy পরিবর্তন নির্দেশিকা: কিভাবে ফ্ল্যাশ লিজেন্ডারি পেট পেতে হয়

Claude Code Buddy পরিবর্তন নির্দেশিকা: কিভাবে ফ্ল্যাশ লিজেন্ডারি পেট পেতে হয় 2026 সালের ১ এপ্রিল, Anthropic Claude Code...

Obsidian Defuddle চালু করেছে, Obsidian Web Clipper কে একটি নতুন উচ্চতায় নিয়ে গেছেTechnology

Obsidian Defuddle চালু করেছে, Obsidian Web Clipper কে একটি নতুন উচ্চতায় নিয়ে গেছে

Obsidian Defuddle চালু করেছে, Obsidian Web Clipper কে একটি নতুন উচ্চতায় নিয়ে গেছে আমি সবসময় Obsidian এর মূল ধারণা পছ...

OpenAI হঠাৎ ঘোষণা করেছে "তিন-এক": ব্রাউজার + প্রোগ্রামিং + ChatGPT একত্রিত, অভ্যন্তরীণভাবে স্বীকার করেছে গত এক বছরে ভুল পথে গিয়েছিলTechnology

OpenAI হঠাৎ ঘোষণা করেছে "তিন-এক": ব্রাউজার + প্রোগ্রামিং + ChatGPT একত্রিত, অভ্যন্তরীণভাবে স্বীকার করেছে গত এক বছরে ভুল পথে গিয়েছিল

OpenAI হঠাৎ ঘোষণা করেছে "তিন-এক": ব্রাউজার + প্রোগ্রামিং + ChatGPT একত্রিত, অভ্যন্তরীণভাবে স্বীকার করেছে গত এক বছরে ভুল ...

2026, নিজেকে 'শৃঙ্খলা' করতে আর চাপ দেবেন না! এই 8টি ছোট কাজ করুন, স্বাস্থ্য স্বাভাবিকভাবেই আসবেHealth

2026, নিজেকে 'শৃঙ্খলা' করতে আর চাপ দেবেন না! এই 8টি ছোট কাজ করুন, স্বাস্থ্য স্বাভাবিকভাবেই আসবে

2026, নিজেকে 'শৃঙ্খলা' করতে আর চাপ দেবেন না! এই 8টি ছোট কাজ করুন, স্বাস্থ্য স্বাভাবিকভাবেই আসবে নতুন বছরের শুরু, গত বছর...

যে সব মায়েরা কঠোর পরিশ্রম করেও ওজন কমাতে পারছেন না, তারা এখানে পড়ে যাচ্ছেনHealth

যে সব মায়েরা কঠোর পরিশ্রম করেও ওজন কমাতে পারছেন না, তারা এখানে পড়ে যাচ্ছেন

যে সব মায়েরা কঠোর পরিশ্রম করেও ওজন কমাতে পারছেন না, তারা এখানে পড়ে যাচ্ছেন মার্চ মাসের অর্ধেক পেরিয়ে গেছে, আপনার ওজন...

📝
Technology

AI Browser 24 ঘণ্টা স্থিতিশীল চলাচলের নির্দেশিকা

AI Browser 24 ঘণ্টা স্থিতিশীল চলাচলের নির্দেশিকা এই টিউটোরিয়ালটি একটি স্থিতিশীল, দীর্ঘমেয়াদী AI ব্রাউজার পরিবেশ কিভাবে...