Qwen 3.5 প্রকাশ: 397B প্যারামিটারের ওপেন ওয়েট মডেল, খরচ 60% কম

আলিবাবা এইমাত্র Qwen 3.5-397B-A17B প্রকাশ করেছে। এটি Qwen 3.5 সিরিজের প্রথম ওপেন ওয়েট মডেল।

মূল ডেটা

মোট প্যারামিটার: 397B
অ্যাক্টিভ প্যারামিটার: 17B per pass (স্পার্স MoE)
থ্রুপুট: Qwen 3-Max এর চেয়ে 8.6x-19x বেশি
খরচ: Qwen 3 এর চেয়ে 60% কম
ভাষা সমর্থন: 201টি (119টি থেকে বাড়ানো হয়েছে)

এটি শুধু প্যারামিটার স্তূপ করা নয়। এটি দক্ষতার নতুন সংজ্ঞা।

Qwen 3.5

আর্কিটেকচার উদ্ভাবন

Qwen 3.5 একটি মিশ্র আর্কিটেকচার ব্যবহার করে:

Gated Delta Networks + স্পার্স MoE
মিশ্র লিনিয়ার অ্যাটেনশন: বেশিরভাগ লেয়ার লিনিয়ার অ্যাটেনশন ব্যবহার করে, প্রতি 4টি লেয়ারে ফুল অ্যাটেনশন ব্যবহার করা হয়
নেটিভ মাল্টিমোডাল: এটি পরে যোগ করা হয়নি, বরং শুরু থেকেই প্রশিক্ষণ দেওয়া হয়েছে

X-এ প্রযুক্তিগত বিশ্লেষণ রয়েছে:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

এই আর্কিটেকচারের তাৎপর্য হল: 17B অ্যাক্টিভ প্যারামিটার ব্যবহার করে 400B মডেলের কাছাকাছি পারফরম্যান্স পাওয়া যায়। অনুমানের খরচ অনেক কমে যায়।

পারফরম্যান্সের দাবি

আলিবাবা দাবি করেছে যে Qwen 3.5 পরাজিত করেছে:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

X-এ স্বতন্ত্র পরীক্ষকরা যাচাই করা শুরু করেছেন:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

তবে সবচেয়ে গুরুত্বপূর্ণ বিষয় হল বেঞ্চমার্ক নয়, বরং এজেন্ট ক্ষমতা:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

এজেন্ট যুগ

Qwen 3.5 এর অবস্থান স্পষ্ট: এজেন্ট যুগের জন্য ডিজাইন করা।

2 ঘণ্টার ভিডিও বিশ্লেষণ করতে পারে
অ্যাপ্লিকেশন জুড়ে স্বাধীনভাবে কাজ করতে পারে
GUI বুঝতে এবং তার সাথে যোগাযোগ করতে পারে

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

এর মানে হল এটি শুধু 'চ্যাটবট' নয়, বরং 'টাস্ক এক্সিকিউটর'।

প্রতিযোগিতামূলক পরিস্থিতি

X-এ একজন এই সপ্তাহের AI প্রকাশনার সারসংক্ষেপ করেছেন:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

চীনা মডেল নির্মাতাদের কৌশল স্পষ্ট:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

প্রতি সপ্তাহে নতুন মডেল আসছে, এবং প্রত্যেকটি GPT-কে হারানোর দাবি করছে। এটি শুধু মার্কেটিং নয়, এটি হল খরচের যুদ্ধের অগ্রগতি।

খরচ কাঠামো

Qwen 3.5 এর টোকেন মূল্য Gemini 3 Pro এর মাত্র 1/18 ভাগ।

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

যখন পারফরম্যান্স কাছাকাছি এবং খরচ মাত্র 5%, তখন ক্লোজড সোর্স মডেলের সুরক্ষা কোথায়?

সারসংক্ষেপ

Qwen 3.5 শুধু 'চীনের GPT' নয়। এটি হল খরচ কাঠামোর পরিবর্তনকারী:

397B প্যারামিটার, কিন্তু শুধুমাত্র 17B সক্রিয়
ওপেন ওয়েট, স্থানীয়ভাবে স্থাপন করা যায়
এজেন্ট ক্ষমতা, শুধু কথোপকথন নয়
খরচ প্রতিযোগীদের তুলনায় মাত্র 5%

X-এ একটি মজার ভবিষ্যদ্বাণী করা হয়েছে:

"Qwen 3.5 Q4 সংস্করণটির জন্য মাত্র 225G প্রয়োজন, যা খুবই ব্যবহারিক" — @janxin

225GB VRAM, একক মেশিনে চালানো যায়। এর মানে হল ছোট এবং মাঝারি আকারের ডেভেলপাররা প্রথমবারের মতো GPT-5 স্তরের কাছাকাছি মডেল ব্যবহার করতে পারবে।

আসল প্রশ্ন হল Qwen 3.5 GPT-5.3 কে হারাতে পারবে কিনা, তা নয়, বরং: যখন শীর্ষ মডেলগুলোর খরচ প্রায় শূন্যের কাছাকাছি নেমে আসবে, তখন AI কোম্পানিগুলো কীভাবে অর্থ উপার্জন করবে?

Qwen 3.5 প্রকাশ: 397B প্যারামিটারের ওপেন ওয়েট মডেল, খরচ 60% কম

মূল ডেটা

আর্কিটেকচার উদ্ভাবন

পারফরম্যান্সের দাবি

এজেন্ট যুগ

প্রতিযোগিতামূলক পরিস্থিতি

খরচ কাঠামো

সারসংক্ষেপ

You Might Also Like

Claude Code Buddy পরিবর্তন নির্দেশিকা: কিভাবে ফ্ল্যাশ লিজেন্ডারি পেট পেতে হয়

Obsidian Defuddle চালু করেছে, Obsidian Web Clipper কে একটি নতুন উচ্চতায় নিয়ে গেছে

2026, নিজেকে 'শৃঙ্খলা' করতে আর চাপ দেবেন না! এই 8টি ছোট কাজ করুন, স্বাস্থ্য স্বাভাবিকভাবেই আসবে

যে সব মায়েরা কঠোর পরিশ্রম করেও ওজন কমাতে পারছেন না, তারা এখানে পড়ে যাচ্ছেন

AI Browser 24 ঘণ্টা স্থিতিশীল চলাচলের নির্দেশিকা