Qwen 3.5 Yatolewa: Mfumo wa Uzani Huria wa Vigezo 397B, Gharama Imepunguzwa kwa 60%

Alibaba imetoa hivi punde Qwen 3.5-397B-A17B. Huu ndio mfumo wa kwanza wa uzani huria wa mfululizo wa Qwen 3.5.

Data Muhimu

Jumla ya Vigezo: 397B
Vigezo Vinavyotumika: 17B per pass (MoE adimu)
Uzalishaji: Umeongezeka kwa 8.6x-19x kuliko Qwen 3-Max
Gharama: Imepunguzwa kwa 60% kuliko Qwen 3
Usaidizi wa Lugha: Aina 201 (imepanuliwa kutoka aina 119)

Hii siyo tu kurundika vigezo. Hii ni ufafanuzi mpya wa ufanisi.

Qwen 3.5

Ubunifu wa Usanifu

Qwen 3.5 inatumia usanifu mchanganyiko:

Gated Delta Networks + MoE adimu
Umakinifu Mchanganyiko wa Linear: Tabaka nyingi hutumia umakinifu wa linear, kila tabaka 4 hutumia umakinifu kamili
Multimodal Asili: Siyo kuongezwa baadaye, bali imefunzwa tangu mwanzo

Kuna uchambuzi wa kiufundi kwenye X:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Umuhimu wa usanifu huu ni: kufikia utendaji wa mfumo wa karibu 400B kwa vigezo 17B vinavyotumika. Gharama za uendeshaji zimepungua sana.

Madai ya Utendaji

Alibaba inadai kwamba Qwen 3.5 imeshinda:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

Wajaribu huru kwenye X wanaanza kuthibitisha:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Lakini muhimu zaidi siyo vipimo, bali ni uwezo wa wakala:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Enzi ya Wakala

Msimamo wa Qwen 3.5 ni wazi: iliyoundwa kwa ajili ya enzi ya wakala.

Inaweza kuchambua video ya saa 2
Inaweza kutekeleza kazi za programu mbalimbali kwa kujitegemea
Inaweza kuelewa GUI na kuingiliana nayo

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Hii inamaanisha kwamba siyo "roboti ya mazungumzo", bali ni "kitekelezaji kazi".

Mazingira ya Ushindani

Kuna mtu kwenye X alifanya muhtasari wa matoleo ya AI ya wiki hii:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Mdundo wa watengenezaji wa mifumo ya Kichina ni wazi:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

Kuna mfumo mpya kila wiki, na kila mmoja anadai kumshinda GPT. Hii siyo uuzaji, hii ni ongezeko la vita vya gharama.

Muundo wa Gharama

Bei ya tokeni ya Qwen 3.5 ni 1/18 tu ya Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Utendaji unapokaribia, na gharama ni 5% tu, ngome ya mifumo iliyofungwa iko wapi?

Hitimisho

Qwen 3.5 siyo "GPT ya Kichina". Ni mharibifu wa muundo wa gharama:

Vigezo 397B, lakini 17B tu ndivyo vinavyotumika
Uzani huria, unaweza kuwekwa ndani
Uwezo wa wakala, siyo mazungumzo tu
Gharama ni 5% tu ya washindani

Kuna utabiri wa kuvutia kwenye X:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

Kumbukumbu ya picha ya 225GB, inaweza kuendeshwa kwenye mashine moja. Hii inamaanisha kwamba watengenezaji wadogo na wa kati wanaweza kufikia mfumo wa karibu kiwango cha GPT-5 kwa mara ya kwanza.

Swali halisi siyo kama Qwen 3.5 inaweza kumshinda GPT-5.3, lakini: kampuni za AI zinapataje pesa wakati gharama ya mifumo ya juu inapungua hadi karibu sifuri?

Qwen 3.5 Yatolewa: Mfumo wa Uzani Huria wa Vigezo 397B, Gharama Imepunguzwa kwa 60%

Data Muhimu

Ubunifu wa Usanifu

Madai ya Utendaji

Enzi ya Wakala

Mazingira ya Ushindani

Muundo wa Gharama

Hitimisho

You Might Also Like

Claude Code Buddy 修改指南：如何获得闪光传说级宠物

Obsidian ilizindua Defuddle, ikainua Obsidian Web Clipper hadi kiwango kipya

OpenAI ilitangaza ghafla "mchanganyiko wa tatu": kivinjari + programu + ChatGPT, ndani wanakubali kuwa walikosea mwaka uliopita

2026, usijilazimishe tena "kujiweka sawa"! Fanya mambo haya 8 madogo, afya itakuja kwa asili

Mama ambao wanajitahidi kupunguza uzito lakini hawawezi, hakika wanakutana na hili

AI Browser 24小时稳定运行指南