Qwen 3.5 Yatolewa: Mfumo wa Uzani Huria wa Vigezo 397B, Gharama Imepunguzwa kwa 60%
Alibaba imetoa hivi punde Qwen 3.5-397B-A17B. Huu ndio mfumo wa kwanza wa uzani huria wa mfululizo wa Qwen 3.5.
Data Muhimu
- Jumla ya Vigezo: 397B
- Vigezo Vinavyotumika: 17B per pass (MoE adimu)
- Uzalishaji: Umeongezeka kwa 8.6x-19x kuliko Qwen 3-Max
- Gharama: Imepunguzwa kwa 60% kuliko Qwen 3
- Usaidizi wa Lugha: Aina 201 (imepanuliwa kutoka aina 119)
Hii siyo tu kurundika vigezo. Hii ni ufafanuzi mpya wa ufanisi.

Ubunifu wa Usanifu
Qwen 3.5 inatumia usanifu mchanganyiko:
- Gated Delta Networks + MoE adimu
- Umakinifu Mchanganyiko wa Linear: Tabaka nyingi hutumia umakinifu wa linear, kila tabaka 4 hutumia umakinifu kamili
- Multimodal Asili: Siyo kuongezwa baadaye, bali imefunzwa tangu mwanzo
Kuna uchambuzi wa kiufundi kwenye X:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Umuhimu wa usanifu huu ni: kufikia utendaji wa mfumo wa karibu 400B kwa vigezo 17B vinavyotumika. Gharama za uendeshaji zimepungua sana.
Madai ya Utendaji
Alibaba inadai kwamba Qwen 3.5 imeshinda:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
Wajaribu huru kwenye X wanaanza kuthibitisha:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Lakini muhimu zaidi siyo vipimo, bali ni uwezo wa wakala:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Enzi ya Wakala
Msimamo wa Qwen 3.5 ni wazi: iliyoundwa kwa ajili ya enzi ya wakala.
- Inaweza kuchambua video ya saa 2
- Inaweza kutekeleza kazi za programu mbalimbali kwa kujitegemea
- Inaweza kuelewa GUI na kuingiliana nayo
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
Hii inamaanisha kwamba siyo "roboti ya mazungumzo", bali ni "kitekelezaji kazi".
Mazingira ya Ushindani
Kuna mtu kwenye X alifanya muhtasari wa matoleo ya AI ya wiki hii:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Mdundo wa watengenezaji wa mifumo ya Kichina ni wazi:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Kuna mfumo mpya kila wiki, na kila mmoja anadai kumshinda GPT. Hii siyo uuzaji, hii ni ongezeko la vita vya gharama.
Muundo wa Gharama
Bei ya tokeni ya Qwen 3.5 ni 1/18 tu ya Gemini 3 Pro.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Utendaji unapokaribia, na gharama ni 5% tu, ngome ya mifumo iliyofungwa iko wapi?
Hitimisho
Qwen 3.5 siyo "GPT ya Kichina". Ni mharibifu wa muundo wa gharama:
- Vigezo 397B, lakini 17B tu ndivyo vinavyotumika
- Uzani huria, unaweza kuwekwa ndani
- Uwezo wa wakala, siyo mazungumzo tu
- Gharama ni 5% tu ya washindani
Kuna utabiri wa kuvutia kwenye X:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
Kumbukumbu ya picha ya 225GB, inaweza kuendeshwa kwenye mashine moja. Hii inamaanisha kwamba watengenezaji wadogo na wa kati wanaweza kufikia mfumo wa karibu kiwango cha GPT-5 kwa mara ya kwanza.
Swali halisi siyo kama Qwen 3.5 inaweza kumshinda GPT-5.3, lakini: kampuni za AI zinapataje pesa wakati gharama ya mifumo ya juu inapungua hadi karibu sifuri?





