Qwen 3.5 প্রকাশ: 397B প্যারামিটারের ওপেন ওয়েট মডেল, খরচ 60% কম
আলিবাবা এইমাত্র Qwen 3.5-397B-A17B প্রকাশ করেছে। এটি Qwen 3.5 সিরিজের প্রথম ওপেন ওয়েট মডেল।
মূল ডেটা
- মোট প্যারামিটার: 397B
- অ্যাক্টিভ প্যারামিটার: 17B per pass (স্পার্স MoE)
- থ্রুপুট: Qwen 3-Max এর চেয়ে 8.6x-19x বেশি
- খরচ: Qwen 3 এর চেয়ে 60% কম
- ভাষা সমর্থন: 201টি (119টি থেকে বাড়ানো হয়েছে)
এটি শুধু প্যারামিটার স্তূপ করা নয়। এটি দক্ষতার নতুন সংজ্ঞা।

আর্কিটেকচার উদ্ভাবন
Qwen 3.5 একটি মিশ্র আর্কিটেকচার ব্যবহার করে:
- Gated Delta Networks + স্পার্স MoE
- মিশ্র লিনিয়ার অ্যাটেনশন: বেশিরভাগ লেয়ার লিনিয়ার অ্যাটেনশন ব্যবহার করে, প্রতি 4টি লেয়ারে ফুল অ্যাটেনশন ব্যবহার করা হয়
- নেটিভ মাল্টিমোডাল: এটি পরে যোগ করা হয়নি, বরং শুরু থেকেই প্রশিক্ষণ দেওয়া হয়েছে
X-এ প্রযুক্তিগত বিশ্লেষণ রয়েছে:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
এই আর্কিটেকচারের তাৎপর্য হল: 17B অ্যাক্টিভ প্যারামিটার ব্যবহার করে 400B মডেলের কাছাকাছি পারফরম্যান্স পাওয়া যায়। অনুমানের খরচ অনেক কমে যায়।
পারফরম্যান্সের দাবি
আলিবাবা দাবি করেছে যে Qwen 3.5 পরাজিত করেছে:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
X-এ স্বতন্ত্র পরীক্ষকরা যাচাই করা শুরু করেছেন:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
তবে সবচেয়ে গুরুত্বপূর্ণ বিষয় হল বেঞ্চমার্ক নয়, বরং এজেন্ট ক্ষমতা:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
এজেন্ট যুগ
Qwen 3.5 এর অবস্থান স্পষ্ট: এজেন্ট যুগের জন্য ডিজাইন করা।
- 2 ঘণ্টার ভিডিও বিশ্লেষণ করতে পারে
- অ্যাপ্লিকেশন জুড়ে স্বাধীনভাবে কাজ করতে পারে
- GUI বুঝতে এবং তার সাথে যোগাযোগ করতে পারে
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
এর মানে হল এটি শুধু 'চ্যাটবট' নয়, বরং 'টাস্ক এক্সিকিউটর'।
প্রতিযোগিতামূলক পরিস্থিতি
X-এ একজন এই সপ্তাহের AI প্রকাশনার সারসংক্ষেপ করেছেন:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
চীনা মডেল নির্মাতাদের কৌশল স্পষ্ট:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
প্রতি সপ্তাহে নতুন মডেল আসছে, এবং প্রত্যেকটি GPT-কে হারানোর দাবি করছে। এটি শুধু মার্কেটিং নয়, এটি হল খরচের যুদ্ধের অগ্রগতি।
খরচ কাঠামো
Qwen 3.5 এর টোকেন মূল্য Gemini 3 Pro এর মাত্র 1/18 ভাগ।
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
যখন পারফরম্যান্স কাছাকাছি এবং খরচ মাত্র 5%, তখন ক্লোজড সোর্স মডেলের সুরক্ষা কোথায়?
সারসংক্ষেপ
Qwen 3.5 শুধু 'চীনের GPT' নয়। এটি হল খরচ কাঠামোর পরিবর্তনকারী:
- 397B প্যারামিটার, কিন্তু শুধুমাত্র 17B সক্রিয়
- ওপেন ওয়েট, স্থানীয়ভাবে স্থাপন করা যায়
- এজেন্ট ক্ষমতা, শুধু কথোপকথন নয়
- খরচ প্রতিযোগীদের তুলনায় মাত্র 5%
X-এ একটি মজার ভবিষ্যদ্বাণী করা হয়েছে:
"Qwen 3.5 Q4 সংস্করণটির জন্য মাত্র 225G প্রয়োজন, যা খুবই ব্যবহারিক" — @janxin
225GB VRAM, একক মেশিনে চালানো যায়। এর মানে হল ছোট এবং মাঝারি আকারের ডেভেলপাররা প্রথমবারের মতো GPT-5 স্তরের কাছাকাছি মডেল ব্যবহার করতে পারবে।
আসল প্রশ্ন হল Qwen 3.5 GPT-5.3 কে হারাতে পারবে কিনা, তা নয়, বরং: যখন শীর্ষ মডেলগুলোর খরচ প্রায় শূন্যের কাছাকাছি নেমে আসবে, তখন AI কোম্পানিগুলো কীভাবে অর্থ উপার্জন করবে?

