গুগল নীরবে ডিপ থিঙ্ক আপডেট করেছে, ARC-AGI-2 সরাসরি ৮৪.৬%-এ পৌঁছেছে

2/14/2026
2 min read

গুগল নীরবে ডিপ থিঙ্ক আপডেট করেছে, ARC-AGI-2 সরাসরি ৮৪.৬%-এ পৌঁছেছে

এইমাত্র, Google DeepMind জেমিনি ৩-এর ডেডিকেটেড রিজনিং মোড ডিপ থিঙ্ক আপডেট করেছে, এবং স্কোরিং সরাসরি শীর্ষে চলে গেছে।

ডিপ থিঙ্ক

জানতে হবে, ARC-AGI-2 বর্তমানে AI-এর রিজনিং ক্ষমতা পরীক্ষার জন্য একটি অগ্রণী বেঞ্চমার্ক হিসেবে স্বীকৃত, আগে কোনো মডেল এতে বিশেষভাবে ভালো স্কোর করতে পারেনি।

বেঞ্চমার্ক তুলনা

আপডেট করার পরে ডিপ থিঙ্ক ৮৪.৬% স্কোর করেছে, তুলনা করলে: Claude Opus 4.6-এর স্কোর ৬৮.৮%, GPT-5.2-এর ৫২.৯%, এমনকি তাদের নিজস্ব জেমিনি ৩ প্রো প্রিভিউ-এর স্কোরও মাত্র ৩১.১%।

বিশাল উন্নতি।

শুধুমাত্র রিজনিং নয়

ডিপ থিঙ্কের উচ্চাকাঙ্ক্ষা স্পষ্টতই শুধুমাত্র রিজনিং-এর মধ্যে সীমাবদ্ধ নয়।

শুধুমাত্র রিজনিং নয়

Humanity's Last Exam নামক বেঞ্চমার্কে, যা "মানবতার শেষ পরীক্ষা" নামে পরিচিত, ডিপ থিঙ্ক ৪৮.৪% স্কোর করেছে, এই পরীক্ষাটি গণিত, বিজ্ঞান এবং প্রকৌশল ক্ষেত্রের কঠিনতম সমস্যাগুলি কভার করে। Claude Opus 4.6-এর স্কোর ৪০.০%, GPT-5.2-এর ৩৪.৫%।

প্রোগ্রামিংয়ের ক্ষেত্রেও এটি খুব শক্তিশালী:

Codeforces-এ ডিপ থিঙ্ক Elo ৩4৫৫-এ পৌঁছেছে, যেখানে জেমিনি ৩ প্রো প্রিভিউ-এর ২৫১২ এবং Claude Opus 4.6-এর ২৩৫২।

Codeforces

এছাড়াও, মাল্টিমোডাল আন্ডারস্ট্যান্ডিং এবং রিজনিং-এর MMMU-Pro বেঞ্চমার্কে, ডিপ থিঙ্ক ৮১.৫% নিয়ে এগিয়ে আছে, তবে এখানে অন্যান্য মডেলগুলোর মধ্যে পার্থক্য তেমন বেশি নয়: জেমিনি ৩ প্রো প্রিভিউ ৮১.০%, GPT-5.2 ৭৯.৫%, Claude Opus 4.6 ৭৩.৯%।

MMMU-Pro

স্কোরিং ছাড়াও, ডিপ থিঙ্ক ২০২৫ সালের পদার্থবিদ্যা এবং রসায়ন অলিম্পিয়াডের লিখিত অংশে স্বর্ণপদক স্তরের ফলাফল অর্জন করেছে।

বিজ্ঞান বিষয়ক সমস্যা সমাধান করতে হবে

Google DeepMind এইবার বিশেষভাবে জোর দিয়েছে যে, আপডেট করা ডিপ থিঙ্ক আর শুধুমাত্র সমস্যা সমাধানের মেশিন নয়, বরং বাস্তব বিশ্বের বিজ্ঞান এবং প্রকৌশল সমস্যাগুলি সমাধান করবে

বিজ্ঞান বিষয়ক সমস্যা

তারা ডিউক ইউনিভার্সিটির ওয়াং ল্যাবের একটি উদাহরণ দেখিয়েছে: গবেষকরা নতুন সেমিকন্ডাক্টর উপাদান ডিজাইন করতে, জটিল স্ফটিকের বৃদ্ধি প্রক্রিয়া অপ্টিমাইজ করতে ডিপ থিঙ্ক ব্যবহার করছেন, এই স্ফটিকগুলি উচ্চ-তাপমাত্রার সেমিকন্ডাক্টরের জন্য সম্ভাব্য উপাদান।

ডিউক উদাহরণ

যন্ত্র প্রকৌশল

এছাড়াও, যন্ত্র প্রকৌশল ক্ষেত্রের গবেষকরা এটিকে ফিজিক্যাল প্রোটোটাইপ পুনরাবৃত্তি করতে ব্যবহার করছেন, যা হার্ডওয়্যার পুনরাবৃত্তিকে সফটওয়্যার পুনরাবৃত্তির গতিতে পৌঁছে দিয়েছে, সহায়ক ডিভাইস ইত্যাদি ক্ষেত্রে এর অর্থ হল দ্রুত উন্নতির চক্র।

কিভাবে ব্যবহার করবেন

আপডেট করা ডিপ থিঙ্ক মোডটি এখন জেমিনি অ্যাপে Google AI Ultra সাবস্ক্রিপশন ব্যবহারকারীদের জন্য রোল আউট করা শুরু হয়েছে।

কিভাবে ব্যবহার করবেন

গবেষক এবং ডেভেলপারদের জন্য, Google Vertex AI আর্লি অ্যাক্সেস প্রোগ্রাম উন্মুক্ত করেছে, যা API-এর মাধ্যমে ব্যবহার করা যেতে পারে।

Vertex AI আর্লি অ্যাক্সেস: https://goo.gle/4rMHUlq

Published in Technology

You Might Also Like

কিভাবে ক্লাউড কম্পিউটিং প্রযুক্তি ব্যবহার করবেন: আপনার প্রথম ক্লাউড অবকাঠামো নির্মাণের সম্পূর্ণ গাইডTechnology

কিভাবে ক্লাউড কম্পিউটিং প্রযুক্তি ব্যবহার করবেন: আপনার প্রথম ক্লাউড অবকাঠামো নির্মাণের সম্পূর্ণ গাইড

[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLD...

সতর্কতা! Claude Code এর জনক স্পষ্ট বললেন: ১ মাস পর Plan Mode ব্যবহার না করলে সফটওয়্যার ইঞ্জিনিয়ারের উপাধি বিলীন হয়ে যাবেTechnology

সতর্কতা! Claude Code এর জনক স্পষ্ট বললেন: ১ মাস পর Plan Mode ব্যবহার না করলে সফটওয়্যার ইঞ্জিনিয়ারের উপাধি বিলীন হয়ে যাবে

সতর্কতা! Claude Code এর জনক স্পষ্ট বললেন: ১ মাস পর Plan Mode ব্যবহার না করলে সফটওয়্যার ইঞ্জিনিয়ারের উপাধি বিলীন হয়ে য...

2026 সালের শীর্ষ 10 গভীর শিক্ষার সম্পদ সুপারিশTechnology

2026 সালের শীর্ষ 10 গভীর শিক্ষার সম্পদ সুপারিশ

2026 সালের শীর্ষ 10 গভীর শিক্ষার সম্পদ সুপারিশ গভীর শিক্ষার বিভিন্ন ক্ষেত্রে দ্রুত উন্নতির সাথে সাথে, আরও বেশি শেখার সম্...

2026 সালের শীর্ষ 10 AI এজেন্ট: মূল বিক্রয় পয়েন্ট বিশ্লেষণTechnology

2026 সালের শীর্ষ 10 AI এজেন্ট: মূল বিক্রয় পয়েন্ট বিশ্লেষণ

2026 সালের শীর্ষ 10 AI এজেন্ট: মূল বিক্রয় পয়েন্ট বিশ্লেষণ ভূমিকা কৃত্রিম বুদ্ধিমত্তার দ্রুত উন্নতির সাথে, AI এজেন্ট (A...

2026 সালের শীর্ষ 10 AI টুলের সুপারিশ: কৃত্রিম বুদ্ধিমত্তার প্রকৃত সম্ভাবনা মুক্ত করুনTechnology

2026 সালের শীর্ষ 10 AI টুলের সুপারিশ: কৃত্রিম বুদ্ধিমত্তার প্রকৃত সম্ভাবনা মুক্ত করুন

2026 সালের শীর্ষ 10 AI টুলের সুপারিশ: কৃত্রিম বুদ্ধিমত্তার প্রকৃত সম্ভাবনা মুক্ত করুন বর্তমান প্রযুক্তির দ্রুত উন্নয়নের...

2026 সালের শীর্ষ 10 AWS টুল এবং সম্পদ সুপারিশTechnology

2026 সালের শীর্ষ 10 AWS টুল এবং সম্পদ সুপারিশ

2026 সালের শীর্ষ 10 AWS টুল এবং সম্পদ সুপারিশ দ্রুত বিকাশমান ক্লাউড কম্পিউটিং ক্ষেত্রে, অ্যামাজন ওয়েব সার্ভিসেস (AWS) স...