জিপিটি-র খরচের দেওয়াল
গত সপ্তাহে, এক্স (X)-এ জিপিটি (GPT) নিয়ে আলোচনা একটি নতুন দিকে মোড় নিয়েছে: ক্ষমতা নয়, বরং খরচ।
এআরসি-এজিআই (ARC-AGI): বুদ্ধিমত্তার সীমা
বর্তমানে সবচেয়ে আধুনিক মডেলগুলির এআরসি-এজিআই-২ (ARC-AGI-2)-এর পারফরম্যান্স:
| মডেল | এআরসি-এজিআই-২ স্কোর |
|---|---|
| GPT-5.2 Pro | ~54% |
| GPT-5.2 Refine | ~73% |
| মানুষ | 100% |
৫৪% থেকে ৭৩%-এর মধ্যে পার্থক্য বুদ্ধিমত্তার সমস্যা নয়, এটি হল 'পরিশোধন' - মডেলটিকে বারবার তার নিজের উত্তর পরীক্ষা করতে দেওয়া। এর জন্য আরও বেশি কম্পিউটিং প্রয়োজন, যার অর্থ আরও বেশি খরচ।
এজেন্টের আসল খরচ
24/7 এন্টারপ্রাইজ-গ্রেড এজেন্টের (প্রতিদিন 20 মিলিয়ন ইনপুট + 20 মিলিয়ন আউটপুট টোকেন) বার্ষিক খরচ:
| মডেল | বার্ষিক খরচ |
|---|---|
| Palmyra X5 | ~$48K |
| GPT-5.2 Standard | ~$57K |
| Gemini 2.5 Pro | ~$82K |
| Claude Sonnet 4.5 | ~$131K |
| Claude Opus 4.6 | ~$219K |
| GPT-5.2 Pro | ~$690K |
GPT-5.2 Standard-এর চেয়ে GPT-5.2 Pro ১২ গুণ বেশি দামি। এটি মূল্য নির্ধারণের কৌশলগত সমস্যা নয়, এটি খরচের কাঠামোগত সমস্যা।
"Before you deploy 100 AI agents, run the math." — @waseem_s "১০০টি এআই (AI) এজেন্ট স্থাপন করার আগে, হিসাব করে নিন।" - @waseem_s
নতুন টিউরিং পরীক্ষা
একটি সহজ প্রশ্ন এখন বুদ্ধিমত্তার নতুন পরীক্ষা হয়ে উঠছে:
"আমার বাড়ি থেকে গাড়ির ধোয়ার দোকান ৪০ মিটার দূরে। আমি গাড়ি ধুতে যেতে চাই। আমার হেঁটে যাওয়া উচিত নাকি গাড়ি চালিয়ে যাওয়া উচিত?"
উত্তীর্ণ মডেল: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro অনুত্তীর্ণ মডেল: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5
কেন এই পরীক্ষাটি গুরুত্বপূর্ণ? কারণ এটি 'সাধারণ জ্ঞান'-এর যুক্তি পরীক্ষা করে, 'জ্ঞান পুনরুদ্ধার' নয়। ৪০ মিটার হাঁটার দূরত্ব। গাড়ি নোংরা হলে ধোয়া দরকার। কিন্তু আপনি নোংরা গাড়ি ৪০ মিটার চালিয়ে ধুতে যাবেন না - যদি না আপনার সাধারণ জ্ঞান না থাকে।
ইতিহাস পুনরাবৃত্তি হয় না, তবে ছন্দের মিল থাকে
"বিশেষজ্ঞ সিস্টেমগুলি ১৯৭০-এর দশকে জন্ম নেয়, ১৯৮০-এর দশকে উন্নতি লাভ করে এবং ব্যাপকভাবে এআই-এর ভবিষ্যৎ হিসাবে বিবেচিত হয়।" - @ChombaBupe
GPT মডেলগুলি ২০১৮ সালে জন্ম নেয়, ২০২০-এর দশকে উন্নতি লাভ করে এবং ব্যাপকভাবে এআই-এর ভবিষ্যৎ হিসাবে বিবেচিত হয়।
বিশেষজ্ঞ সিস্টেমগুলির ব্যর্থতা এই কারণে হয়নি যে সেগুলি যথেষ্ট বুদ্ধিমান ছিল না, বরং এই কারণে যে তাদের রক্ষণাবেক্ষণের খরচ খুব বেশি ছিল এবং প্রসারণযোগ্যতা খুব কম ছিল। যখন জ্ঞানভাণ্ডারকে মানুষের দ্বারা রক্ষণাবেক্ষণ করতে হয়, তখন আকারই শত্রু।
জিপিটি-র ক্ষেত্রে একই ধরনের সমস্যা দেখা যাচ্ছে: মডেলগুলি বুদ্ধিমান, কিন্তু যুক্তির খরচ খুব বেশি। যখন প্রতিটি অনুরোধের জন্য প্রচুর কম্পিউটিং প্রয়োজন হয়, তখন আকার একইভাবে শত্রু।
পরবর্তী পদক্ষেপ
এই সপ্তাহে বেশ কয়েকটি নতুন মডেল প্রকাশের সম্ভাবনা রয়েছে: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5।
প্রতিযোগিতা 'কে বেশি বুদ্ধিমান' থেকে সরে গিয়ে 'কে বেশি সস্তা' -এর দিকে যাচ্ছে। এটি ব্যবহারকারীদের জন্য ভালো খবর। ওপেনএআই (OpenAI)-এর জন্য? সম্ভবত নয়।





