এলএলএম হল পরবর্তী জেপিইজি
আমাকে একটা গল্প বলতে দিন।
১৯৯০-এর দশকে, আপনি যদি কাউকে একটি ছবি পাঠাতে চাইতেন, তাহলে আপনাকে অনেক কিছু বিবেচনা করতে হত: ফাইলের ফর্ম্যাট, কম্প্রেশন অ্যালগরিদম, রঙের গভীরতা। প্রতিটি সফ্টওয়্যারের নিজস্ব ফর্ম্যাট ছিল। তারপর JPEG এল।
হঠাৎ করে, কেউ আর ছবির ফর্ম্যাট নিয়ে মাথা ঘামায় না। JPEG একটি অবকাঠামো হয়ে উঠেছে। আপনি বলবেন না "আমি JPEG দিয়ে একটি ছবি তৈরি করেছি", আপনি শুধু বলবেন "আমি একটি ছবি পাঠিয়েছি"।
এলএলএম একই পথে চলছে।
যখন প্রযুক্তি বাতাসে পরিণত হয়
"এলএলএম একটি পণ্য। অ্যাপল এলএলএম কোম্পানি থেকে টোকেন কিনতে পেরে খুশি, কিন্তু অ্যাপল একটি পার্থক্যযুক্ত পণ্য বিক্রি করা কোম্পানি।" — @deuteronormative
কথাটা সরাসরি বলা হয়েছে। আপনি যদি অ্যাপল হন, আপনি নিজে বিদ্যুৎ উৎপাদন করবেন না, আপনি গ্রিড থেকে বিদ্যুৎ কিনবেন। আপনি নিজে টায়ার তৈরি করবেন না, আপনি মিশেলিন থেকে টায়ার কিনবেন। এখন, আপনি নিজে এলএলএম প্রশিক্ষণ দেবেন না, আপনি ক্লাউড থেকে টোকেন কিনবেন।
এর মানে এই নয় যে এলএলএম গুরুত্বপূর্ণ নয়। বিদ্যুৎ গুরুত্বপূর্ণ। টায়ার গুরুত্বপূর্ণ। কিন্তু এগুলো অবকাঠামো, পার্থক্য করার উপাদান নয়।
খরচ যুদ্ধের বিজয়ী
আলিবাবা সম্প্রতি Qwen 3.5 প্রকাশ করেছে:
- ৩৯৭০ বিলিয়ন প্যারামিটার, ১৭০ বিলিয়ন সক্রিয়
- Qwen 3 এর চেয়ে ৬০% সস্তা
- ৮ গুণ দ্রুত
- টোকেনের দাম জেমিনি ৩ প্রো এর ১/১৮ ভাগ
এটি প্রযুক্তিগত অগ্রগতি নয়, এটি মূল্য যুদ্ধ। এলসিডি টিভির দামও এভাবে কমেছিল। প্রথম কোম্পানি যারা ১০০০ ডলারের নিচে দাম নামিয়েছিল তারা সেরা প্রযুক্তি ব্যবহার করেনি, তবে তারাই ছিল বিজয়ী।
ব্যবহারিক পরামর্শ
আপনি যদি একজন ডেভেলপার হন, তাহলে এর মানে কী?
-
নিজের মডেল তৈরি করবেন না। যদি না আপনি OpenAI, Anthropic বা আলিবাবার মতো হন, মডেল তৈরি করা মানে টাকা পোড়ানো। API ব্যবহার করুন।
-
প্যারামিটারের চেয়ে দামের দিকে মনোযোগ দিন। ৩৯৭০ বিলিয়ন প্যারামিটার শুনতে ভালো লাগে, কিন্তু আপনার ব্যবহারকারীরা এতে আগ্রহী নন। তারা প্রতিক্রিয়ার গতি এবং খরচ নিয়ে চিন্তিত।
-
স্থানান্তর করার জন্য প্রস্তুত থাকুন। এলএলএম একটি পণ্য, মানে এটি প্রতিস্থাপনযোগ্য। আজ GPT ব্যবহার করুন, কাল Claude, পরশু Qwen। আপনার আর্কিটেকচার এই পরিবর্তন সমর্থন করা উচিত।
মজার প্যারাডক্স
যারা এলএলএম সম্পর্কে সবচেয়ে বেশি জানেন তারা এটি নিয়ে খুব কম কথা বলেন।
"Andrej Karpathy ২৪০ লাইনের খাঁটি পাইথন দিয়ে একটি মিনি GPT লিখেছেন। TensorFlow নেই। PyTorch নেই। শুধু গণিত। এটি দেখায় যে এলএলএম জাদু নয় - এগুলো কেবল পরবর্তী টোকেন ভবিষ্যদ্বাণী।"
আপনি যখন বুঝতে পারবেন যে "পরবর্তী টোকেন ভবিষ্যদ্বাণী" হল এই প্রযুক্তির সবকিছু, তখন অনেক হইচই কমে যাবে। এটি ছোট করা নয়। মাইক্রোওয়েভ ওভেন জলের অণু গরম করে, তবে এটি রান্নাঘর পরিবর্তন করে দিয়েছে।
পরবর্তী পদক্ষেপ
এলএলএম JPEG-এর মতো হয়ে উঠবে: সর্বত্র বিরাজমান, কেউ আলোচনা করে না, তবে অপরিহার্য।
তার আগে, বুদ্ধিমান লোকেরা মূল্য যুদ্ধে সবচেয়ে সস্তা সরবরাহকারীকে বেছে নেবে। কারণ যখন প্রযুক্তি পণ্য হয়ে যায়, তখন একমাত্র গুরুত্বপূর্ণ বিষয় হল খরচ।





