Qwen 3.5 Yatolewa: Mfumo wa Uzani Huria wa Vigezo 397B, Gharama Imepunguzwa kwa 60%

2/16/2026
3 min read

Alibaba imetoa hivi punde Qwen 3.5-397B-A17B. Huu ndio mfumo wa kwanza wa uzani huria wa mfululizo wa Qwen 3.5.

Data Muhimu

  • Jumla ya Vigezo: 397B
  • Vigezo Vinavyotumika: 17B per pass (MoE adimu)
  • Uzalishaji: Umeongezeka kwa 8.6x-19x kuliko Qwen 3-Max
  • Gharama: Imepunguzwa kwa 60% kuliko Qwen 3
  • Usaidizi wa Lugha: Aina 201 (imepanuliwa kutoka aina 119)

Hii siyo tu kurundika vigezo. Hii ni ufafanuzi mpya wa ufanisi.

Qwen 3.5

Ubunifu wa Usanifu

Qwen 3.5 inatumia usanifu mchanganyiko:

  • Gated Delta Networks + MoE adimu
  • Umakinifu Mchanganyiko wa Linear: Tabaka nyingi hutumia umakinifu wa linear, kila tabaka 4 hutumia umakinifu kamili
  • Multimodal Asili: Siyo kuongezwa baadaye, bali imefunzwa tangu mwanzo

Kuna uchambuzi wa kiufundi kwenye X:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Umuhimu wa usanifu huu ni: kufikia utendaji wa mfumo wa karibu 400B kwa vigezo 17B vinavyotumika. Gharama za uendeshaji zimepungua sana.

Madai ya Utendaji

Alibaba inadai kwamba Qwen 3.5 imeshinda:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Wajaribu huru kwenye X wanaanza kuthibitisha:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Lakini muhimu zaidi siyo vipimo, bali ni uwezo wa wakala:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Enzi ya Wakala

Msimamo wa Qwen 3.5 ni wazi: iliyoundwa kwa ajili ya enzi ya wakala.

  • Inaweza kuchambua video ya saa 2
  • Inaweza kutekeleza kazi za programu mbalimbali kwa kujitegemea
  • Inaweza kuelewa GUI na kuingiliana nayo

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Hii inamaanisha kwamba siyo "roboti ya mazungumzo", bali ni "kitekelezaji kazi".

Mazingira ya Ushindani

Kuna mtu kwenye X alifanya muhtasari wa matoleo ya AI ya wiki hii:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Mdundo wa watengenezaji wa mifumo ya Kichina ni wazi:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Kuna mfumo mpya kila wiki, na kila mmoja anadai kumshinda GPT. Hii siyo uuzaji, hii ni ongezeko la vita vya gharama.

Muundo wa Gharama

Bei ya tokeni ya Qwen 3.5 ni 1/18 tu ya Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Utendaji unapokaribia, na gharama ni 5% tu, ngome ya mifumo iliyofungwa iko wapi?

Hitimisho

Qwen 3.5 siyo "GPT ya Kichina". Ni mharibifu wa muundo wa gharama:

  1. Vigezo 397B, lakini 17B tu ndivyo vinavyotumika
  2. Uzani huria, unaweza kuwekwa ndani
  3. Uwezo wa wakala, siyo mazungumzo tu
  4. Gharama ni 5% tu ya washindani

Kuna utabiri wa kuvutia kwenye X:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

Kumbukumbu ya picha ya 225GB, inaweza kuendeshwa kwenye mashine moja. Hii inamaanisha kwamba watengenezaji wadogo na wa kati wanaweza kufikia mfumo wa karibu kiwango cha GPT-5 kwa mara ya kwanza.

Swali halisi siyo kama Qwen 3.5 inaweza kumshinda GPT-5.3, lakini: kampuni za AI zinapataje pesa wakati gharama ya mifumo ya juu inapungua hadi karibu sifuri?

Published in Technology

You Might Also Like

Jinsi ya Kutumia Teknolojia ya Wingu: Mwongozo Kamili wa Kujenga Miundombinu Yako ya Kwanza ya WinguTechnology

Jinsi ya Kutumia Teknolojia ya Wingu: Mwongozo Kamili wa Kujenga Miundombinu Yako ya Kwanza ya Wingu

Jinsi ya Kutumia Teknolojia ya Wingu: Mwongozo Kamili wa Kujenga Miundombinu Yako ya Kwanza ya Wingu Utangulizi Kwa kasi...

Tahadhari! Baba wa Claude Code asema: Baada ya mwezi mmoja, kutumia Plan Mode, cheo cha mhandisi wa programu kitapoteaTechnology

Tahadhari! Baba wa Claude Code asema: Baada ya mwezi mmoja, kutumia Plan Mode, cheo cha mhandisi wa programu kitapotea

Tahadhari! Baba wa Claude Code asema: Baada ya mwezi mmoja, kutumia Plan Mode, cheo cha mhandisi wa programu kitapotea ...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026年 Top 10 AI 代理:核心卖点解析Technology

2026年 Top 10 AI 代理:核心卖点解析

2026年 Top 10 AI 代理:核心卖点解析 引言 随着人工智能的快速发展,AI 代理(AI Agents)已成为技术领域的热点话题。越来越多的开发者和企业开始探索如何利用这些智能代理提升工作效率和业务盈利。但在众多的 AI 代理解决...

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力Technology

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力 Katika maendeleo ya haraka ya teknolojia, akili bandia (AI) imekuwa mada maarufu katika...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 Katika uwanja wa haraka unaokua wa huduma za wingu, Amazon Web Services (AWS) imekuwa kiongozi, ...