Qwen 3.5 کا اجراء: 397B پیرامیٹرز کا اوپن ویٹ ماڈل، لاگت میں 60% کمی

2/16/2026
4 min read

علی بابا نے ابھی Qwen 3.5-397B-A17B جاری کیا ہے۔ یہ Qwen 3.5 سیریز کا پہلا اوپن ویٹ ماڈل ہے۔

بنیادی ڈیٹا

  • کل پیرامیٹرز: 397B
  • ایکٹیو پیرامیٹرز: 17B per pass (اسپارس MoE)
  • تھرو پٹ: Qwen 3-Max سے 8.6x-19x زیادہ
  • لاگت: Qwen 3 سے 60% کم
  • زبانوں کی سپورٹ: 201 (119 سے توسیع شدہ)

یہ محض پیرامیٹرز کا ڈھیر نہیں ہے۔ یہ افادیت کی نئی تعریف ہے۔

Qwen 3.5

آرکیٹیکچر میں جدت

Qwen 3.5 ایک مخلوط آرکیٹیکچر استعمال کرتا ہے:

  • Gated Delta Networks + اسپارس MoE
  • مخلوط لکیری توجہ: زیادہ تر تہیں لکیری توجہ استعمال کرتی ہیں، ہر 4 تہوں میں مکمل توجہ
  • اصلی ملٹی ماڈل: بعد میں شامل نہیں کیا گیا، بلکہ شروع سے تربیت دی گئی

X پر تکنیکی تجزیہ موجود ہے:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

اس آرکیٹیکچر کا مطلب یہ ہے کہ: 17B ایکٹیو پیرامیٹرز کے ساتھ 400B ماڈل کی کارکردگی حاصل کرنا۔ استدلال کی لاگت میں نمایاں کمی۔

کارکردگی کے دعوے

علی بابا کا دعویٰ ہے کہ Qwen 3.5 نے شکست دی ہے:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

X پر آزاد ٹیسٹرز نے تصدیق کرنا شروع کر دی ہے:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

لیکن سب سے اہم بات بینچ مارک نہیں ہے، بلکہ ایجنٹ کی صلاحیت ہے:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

ایجنٹ کا دور

Qwen 3.5 کی پوزیشننگ واضح ہے: ایجنٹ کے دور کے لیے ڈیزائن کیا گیا۔

  • 2 گھنٹے کی ویڈیو کا تجزیہ کر سکتا ہے
  • آزادانہ طور پر ایپ کے درمیان کام انجام دے سکتا ہے
  • GUI کو سمجھ سکتا ہے اور اس کے ساتھ تعامل کر سکتا ہے

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

اس کا مطلب ہے کہ یہ 'چیٹ بوٹ' نہیں، بلکہ 'ٹاسک ایگزیکیوٹر' ہے۔

مسابقتی منظرنامہ

X پر کسی نے اس ہفتے کے AI اجراء کا خلاصہ کیا ہے:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

چینی ماڈل بنانے والوں کی رفتار واضح ہے:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

ہر ہفتے ایک نیا ماڈل آتا ہے، اور ہر بار GPT کو شکست دینے کا دعویٰ کیا جاتا ہے۔ یہ مارکیٹنگ نہیں، بلکہ لاگت کی جنگ میں اضافہ ہے۔

لاگت کی ساخت

Qwen 3.5 کی ٹوکن کی قیمت Gemini 3 Pro کی صرف 1/18 ہے۔

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

جب کارکردگی قریب ہو اور لاگت صرف 5% ہو، تو کلوزڈ سورس ماڈل کا دفاع کہاں ہے؟

حتمی بات

Qwen 3.5 'چین کا GPT' نہیں ہے۔ یہ لاگت کی ساخت کو بدلنے والا ہے:

  1. 397B پیرامیٹرز، لیکن صرف 17B ایکٹیویٹ ہوتے ہیں
  2. اوپن ویٹ، مقامی طور پر تعینات کیا جا سکتا ہے
  3. ایجنٹ کی صلاحیت، صرف بات چیت نہیں
  4. لاگت حریفوں کی صرف 5%

X پر ایک دلچسپ پیش گوئی ہے:

"Qwen 3.5 Q4 ورژن只需要 225G,很有实用价值" — @janxin

225GB ویڈیو میموری، اسٹینڈ اکیلے چل سکتا ہے۔ اس کا مطلب ہے کہ چھوٹے اور درمیانے درجے کے ڈویلپرز پہلی بار GPT-5 کی سطح کے ماڈل تک رسائی حاصل کر سکیں گے۔

اصل مسئلہ یہ نہیں ہے کہ Qwen 3.5 GPT-5.3 کو شکست دے سکتا ہے یا نہیں، بلکہ یہ ہے کہ: جب ٹاپ ماڈلز کی لاگت تقریباً صفر ہو جائے گی، تو AI کمپنیاں کیسے پیسہ کمائیں گی؟

Published in Technology

You Might Also Like

کس طرح کلاؤڈ کمپیوٹنگ ٹیکنالوجی کا استعمال کریں: آپ کی پہلی کلاؤڈ بنیادی ڈھانچے کی مکمل رہنمائیTechnology

کس طرح کلاؤڈ کمپیوٹنگ ٹیکنالوجی کا استعمال کریں: آپ کی پہلی کلاؤڈ بنیادی ڈھانچے کی مکمل رہنمائی

کس طرح کلاؤڈ کمپیوٹنگ ٹیکنالوجی کا استعمال کریں: آپ کی پہلی کلاؤڈ بنیادی ڈھانچے کی مکمل رہنمائی تعارف ڈیجیٹل تبدیلی کی ر...

پیشگی خبر! Claude Code کے بانی کا کہنا ہے: ایک مہینے بعد Plan Mode کا استعمال نہ ہونے پر سافٹ ویئر انجینئر کا لقب غائب ہو جائے گاTechnology

پیشگی خبر! Claude Code کے بانی کا کہنا ہے: ایک مہینے بعد Plan Mode کا استعمال نہ ہونے پر سافٹ ویئر انجینئر کا لقب غائب ہو جائے گا

پیشگی خبر! Claude Code کے بانی کا کہنا ہے: ایک مہینے بعد Plan Mode کا استعمال نہ ہونے پر سافٹ ویئر انجینئر کا لقب غائب ہ...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026 سال کے ٹاپ 10 AI ایجنٹس: بنیادی خصوصیات کا تجزیہTechnology

2026 سال کے ٹاپ 10 AI ایجنٹس: بنیادی خصوصیات کا تجزیہ

2026 سال کے ٹاپ 10 AI ایجنٹس: بنیادی خصوصیات کا تجزیہ تعارف مصنوعی ذہانت کی تیز رفتار ترقی کے ساتھ، AI ایجنٹس (AI Agents...

2026 کے ٹاپ 10 AI ٹولز کی سفارش: مصنوعی ذہانت کی حقیقی صلاحیت کو آزاد کرناTechnology

2026 کے ٹاپ 10 AI ٹولز کی سفارش: مصنوعی ذہانت کی حقیقی صلاحیت کو آزاد کرنا

2026 کے ٹاپ 10 AI ٹولز کی سفارش: مصنوعی ذہانت کی حقیقی صلاحیت کو آزاد کرنا آج کی تیز رفتار ٹیکنالوجی کی ترقی میں، مصنوعی...

2026 سال کے ٹاپ 10 AWS ٹولز اور وسائل کی سفارشTechnology

2026 سال کے ٹاپ 10 AWS ٹولز اور وسائل کی سفارش

2026 سال کے ٹاپ 10 AWS ٹولز اور وسائل کی سفارش تیزی سے ترقی پذیر کلاؤڈ کمپیوٹنگ کے میدان میں، Amazon Web Services (AWS) ...