Qwen 3.5 کا اجراء: 397B پیرامیٹرز کا اوپن ویٹ ماڈل، لاگت میں 60% کمی

علی بابا نے ابھی Qwen 3.5-397B-A17B جاری کیا ہے۔ یہ Qwen 3.5 سیریز کا پہلا اوپن ویٹ ماڈل ہے۔

بنیادی ڈیٹا

کل پیرامیٹرز: 397B
ایکٹیو پیرامیٹرز: 17B per pass (اسپارس MoE)
تھرو پٹ: Qwen 3-Max سے 8.6x-19x زیادہ
لاگت: Qwen 3 سے 60% کم
زبانوں کی سپورٹ: 201 (119 سے توسیع شدہ)

یہ محض پیرامیٹرز کا ڈھیر نہیں ہے۔ یہ افادیت کی نئی تعریف ہے۔

Qwen 3.5

آرکیٹیکچر میں جدت

Qwen 3.5 ایک مخلوط آرکیٹیکچر استعمال کرتا ہے:

Gated Delta Networks + اسپارس MoE
مخلوط لکیری توجہ: زیادہ تر تہیں لکیری توجہ استعمال کرتی ہیں، ہر 4 تہوں میں مکمل توجہ
اصلی ملٹی ماڈل: بعد میں شامل نہیں کیا گیا، بلکہ شروع سے تربیت دی گئی

X پر تکنیکی تجزیہ موجود ہے:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

اس آرکیٹیکچر کا مطلب یہ ہے کہ: 17B ایکٹیو پیرامیٹرز کے ساتھ 400B ماڈل کی کارکردگی حاصل کرنا۔ استدلال کی لاگت میں نمایاں کمی۔

کارکردگی کے دعوے

علی بابا کا دعویٰ ہے کہ Qwen 3.5 نے شکست دی ہے:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

X پر آزاد ٹیسٹرز نے تصدیق کرنا شروع کر دی ہے:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

لیکن سب سے اہم بات بینچ مارک نہیں ہے، بلکہ ایجنٹ کی صلاحیت ہے:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

ایجنٹ کا دور

Qwen 3.5 کی پوزیشننگ واضح ہے: ایجنٹ کے دور کے لیے ڈیزائن کیا گیا۔

2 گھنٹے کی ویڈیو کا تجزیہ کر سکتا ہے
آزادانہ طور پر ایپ کے درمیان کام انجام دے سکتا ہے
GUI کو سمجھ سکتا ہے اور اس کے ساتھ تعامل کر سکتا ہے

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

اس کا مطلب ہے کہ یہ 'چیٹ بوٹ' نہیں، بلکہ 'ٹاسک ایگزیکیوٹر' ہے۔

مسابقتی منظرنامہ

X پر کسی نے اس ہفتے کے AI اجراء کا خلاصہ کیا ہے:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

چینی ماڈل بنانے والوں کی رفتار واضح ہے:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

ہر ہفتے ایک نیا ماڈل آتا ہے، اور ہر بار GPT کو شکست دینے کا دعویٰ کیا جاتا ہے۔ یہ مارکیٹنگ نہیں، بلکہ لاگت کی جنگ میں اضافہ ہے۔

لاگت کی ساخت

Qwen 3.5 کی ٹوکن کی قیمت Gemini 3 Pro کی صرف 1/18 ہے۔

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

جب کارکردگی قریب ہو اور لاگت صرف 5% ہو، تو کلوزڈ سورس ماڈل کا دفاع کہاں ہے؟

حتمی بات

Qwen 3.5 'چین کا GPT' نہیں ہے۔ یہ لاگت کی ساخت کو بدلنے والا ہے:

397B پیرامیٹرز، لیکن صرف 17B ایکٹیویٹ ہوتے ہیں
اوپن ویٹ، مقامی طور پر تعینات کیا جا سکتا ہے
ایجنٹ کی صلاحیت، صرف بات چیت نہیں
لاگت حریفوں کی صرف 5%

X پر ایک دلچسپ پیش گوئی ہے:

"Qwen 3.5 Q4 ورژن只需要 225G，很有实用价值" — @janxin

225GB ویڈیو میموری، اسٹینڈ اکیلے چل سکتا ہے۔ اس کا مطلب ہے کہ چھوٹے اور درمیانے درجے کے ڈویلپرز پہلی بار GPT-5 کی سطح کے ماڈل تک رسائی حاصل کر سکیں گے۔

اصل مسئلہ یہ نہیں ہے کہ Qwen 3.5 GPT-5.3 کو شکست دے سکتا ہے یا نہیں، بلکہ یہ ہے کہ: جب ٹاپ ماڈلز کی لاگت تقریباً صفر ہو جائے گی، تو AI کمپنیاں کیسے پیسہ کمائیں گی؟