জিপিটি-র খরচের দেওয়াল

গত সপ্তাহে, এক্স (X)-এ জিপিটি (GPT) নিয়ে আলোচনা একটি নতুন দিকে মোড় নিয়েছে: ক্ষমতা নয়, বরং খরচ।

এআরসি-এজিআই (ARC-AGI): বুদ্ধিমত্তার সীমা

বর্তমানে সবচেয়ে আধুনিক মডেলগুলির এআরসি-এজিআই-২ (ARC-AGI-2)-এর পারফরম্যান্স:

মডেল	এআরসি-এজিআই-২ স্কোর
GPT-5.2 Pro	~54%
GPT-5.2 Refine	~73%
মানুষ	100%

৫৪% থেকে ৭৩%-এর মধ্যে পার্থক্য বুদ্ধিমত্তার সমস্যা নয়, এটি হল 'পরিশোধন' - মডেলটিকে বারবার তার নিজের উত্তর পরীক্ষা করতে দেওয়া। এর জন্য আরও বেশি কম্পিউটিং প্রয়োজন, যার অর্থ আরও বেশি খরচ।

এজেন্টের আসল খরচ

24/7 এন্টারপ্রাইজ-গ্রেড এজেন্টের (প্রতিদিন 20 মিলিয়ন ইনপুট + 20 মিলিয়ন আউটপুট টোকেন) বার্ষিক খরচ:

মডেল	বার্ষিক খরচ
Palmyra X5	~$48K
GPT-5.2 Standard	~$57K
Gemini 2.5 Pro	~$82K
Claude Sonnet 4.5	~$131K
Claude Opus 4.6	~$219K
GPT-5.2 Pro	~$690K

GPT-5.2 Standard-এর চেয়ে GPT-5.2 Pro ১২ গুণ বেশি দামি। এটি মূল্য নির্ধারণের কৌশলগত সমস্যা নয়, এটি খরচের কাঠামোগত সমস্যা।

"Before you deploy 100 AI agents, run the math." — @waseem_s "১০০টি এআই (AI) এজেন্ট স্থাপন করার আগে, হিসাব করে নিন।" - @waseem_s

নতুন টিউরিং পরীক্ষা

একটি সহজ প্রশ্ন এখন বুদ্ধিমত্তার নতুন পরীক্ষা হয়ে উঠছে:

"আমার বাড়ি থেকে গাড়ির ধোয়ার দোকান ৪০ মিটার দূরে। আমি গাড়ি ধুতে যেতে চাই। আমার হেঁটে যাওয়া উচিত নাকি গাড়ি চালিয়ে যাওয়া উচিত?"

উত্তীর্ণ মডেল: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro অনুত্তীর্ণ মডেল: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5

কেন এই পরীক্ষাটি গুরুত্বপূর্ণ? কারণ এটি 'সাধারণ জ্ঞান'-এর যুক্তি পরীক্ষা করে, 'জ্ঞান পুনরুদ্ধার' নয়। ৪০ মিটার হাঁটার দূরত্ব। গাড়ি নোংরা হলে ধোয়া দরকার। কিন্তু আপনি নোংরা গাড়ি ৪০ মিটার চালিয়ে ধুতে যাবেন না - যদি না আপনার সাধারণ জ্ঞান না থাকে।

ইতিহাস পুনরাবৃত্তি হয় না, তবে ছন্দের মিল থাকে

"বিশেষজ্ঞ সিস্টেমগুলি ১৯৭০-এর দশকে জন্ম নেয়, ১৯৮০-এর দশকে উন্নতি লাভ করে এবং ব্যাপকভাবে এআই-এর ভবিষ্যৎ হিসাবে বিবেচিত হয়।" - @ChombaBupe

GPT মডেলগুলি ২০১৮ সালে জন্ম নেয়, ২০২০-এর দশকে উন্নতি লাভ করে এবং ব্যাপকভাবে এআই-এর ভবিষ্যৎ হিসাবে বিবেচিত হয়।

বিশেষজ্ঞ সিস্টেমগুলির ব্যর্থতা এই কারণে হয়নি যে সেগুলি যথেষ্ট বুদ্ধিমান ছিল না, বরং এই কারণে যে তাদের রক্ষণাবেক্ষণের খরচ খুব বেশি ছিল এবং প্রসারণযোগ্যতা খুব কম ছিল। যখন জ্ঞানভাণ্ডারকে মানুষের দ্বারা রক্ষণাবেক্ষণ করতে হয়, তখন আকারই শত্রু।

জিপিটি-র ক্ষেত্রে একই ধরনের সমস্যা দেখা যাচ্ছে: মডেলগুলি বুদ্ধিমান, কিন্তু যুক্তির খরচ খুব বেশি। যখন প্রতিটি অনুরোধের জন্য প্রচুর কম্পিউটিং প্রয়োজন হয়, তখন আকার একইভাবে শত্রু।

পরবর্তী পদক্ষেপ

এই সপ্তাহে বেশ কয়েকটি নতুন মডেল প্রকাশের সম্ভাবনা রয়েছে: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5।

প্রতিযোগিতা 'কে বেশি বুদ্ধিমান' থেকে সরে গিয়ে 'কে বেশি সস্তা' -এর দিকে যাচ্ছে। এটি ব্যবহারকারীদের জন্য ভালো খবর। ওপেনএআই (OpenAI)-এর জন্য? সম্ভবত নয়।

জিপিটি-র খরচের দেওয়াল

এআরসি-এজিআই (ARC-AGI): বুদ্ধিমত্তার সীমা

এজেন্টের আসল খরচ

নতুন টিউরিং পরীক্ষা

ইতিহাস পুনরাবৃত্তি হয় না, তবে ছন্দের মিল থাকে

পরবর্তী পদক্ষেপ

You Might Also Like

Claude Code Buddy পরিবর্তন নির্দেশিকা: কিভাবে ফ্ল্যাশ লিজেন্ডারি পেট পেতে হয়

Obsidian Defuddle চালু করেছে, Obsidian Web Clipper কে একটি নতুন উচ্চতায় নিয়ে গেছে

2026, নিজেকে 'শৃঙ্খলা' করতে আর চাপ দেবেন না! এই 8টি ছোট কাজ করুন, স্বাস্থ্য স্বাভাবিকভাবেই আসবে

যে সব মায়েরা কঠোর পরিশ্রম করেও ওজন কমাতে পারছেন না, তারা এখানে পড়ে যাচ্ছেন

AI Browser 24 ঘণ্টা স্থিতিশীল চলাচলের নির্দেশিকা