Qwen 3.5 gefið út: Opinn þyngdarlíkan með 397B breytum, kostnaður lækkaður um 60%

2/16/2026
3 min read

Alibaba hefur nýlega gefið út Qwen 3.5-397B-A17B. Þetta er fyrsta opna þyngdarlíkanið í Qwen 3.5 seríunni.

Kjarnagögn

  • Heildarbreytur: 397B
  • Virkjaðar breytur: 17B per pass (sparse MoE)
  • Gegnumstreymi: 8.6x-19x betra en Qwen 3-Max
  • Kostnaður: 60% lægri en Qwen 3
  • Tungumálastuðningur: 201 (stækkað úr 119)

Þetta er ekki einföld stafla af breytum. Þetta er endurskilgreining á skilvirkni.

Qwen 3.5

Nýjungar í arkitektúr

Qwen 3.5 notar blendinga arkitektúr:

  • Gated Delta Networks + sparse MoE
  • Blendinga línuleg athygli: Flest lög nota línulega athygli, hvert 4. lag notar fulla athygli
  • Innbyggt fjölbreytileiki: Ekki bætt við seinna, heldur þjálfað frá grunni

Það er tæknileg greining á X:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Merking þessa arkitektúrs er: Að ná frammistöðu nálægt 400B líkani með 17B virkjum breytum. Ályktunarkostnaður lækkar verulega.

Frammistöðuyfirlýsingar

Alibaba fullyrðir að Qwen 3.5 hafi sigrað:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Óháðir prófarar á X eru byrjaðir að staðfesta:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

En það mikilvægasta er ekki viðmiðunarprófanir, heldur umboðsgeta:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Umboðstíminn

Staðsetning Qwen 3.5 er mjög skýr: Hönnuð fyrir umboðstímann.

  • Getur greint 2ja tíma myndbönd
  • Getur sjálfstætt framkvæmt verkefni á milli forrita
  • Getur skilið GUI og átt samskipti við það

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Þetta þýðir að það er ekki „spjallbotni“, heldur „verkefnaframkvæmdaraðili“.

Samkeppnislandslag

Einhver á X dró saman AI útgáfur þessarar viku:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Taktur kínverskra líkanaframleiðenda er mjög skýr:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Nýtt líkan í hverri viku, hvert og eitt fullyrðir að það sigri GPT. Þetta er ekki markaðssetning, þetta er uppfærsla á kostnaðarstríði.

Kostnaðarsamsetning

Token verð Qwen 3.5 er aðeins 1/18 af Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Þegar frammistaðan er svipuð og kostnaðurinn er aðeins 5%, hvar er varnargarður lokaðra líkana?

Niðurstaða

Qwen 3.5 er ekki „kínverskt GPT“. Það er truflun á kostnaðarsamsetningu:

  1. 397B breytur, en aðeins 17B virkjaðar
  2. Opin þyngd, hægt að setja upp staðbundið
  3. Umboðsgeta, ekki bara samtal
  4. Kostnaður aðeins 5% af keppinautum

Það er áhugaverð spá á X:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225GB af minni, hægt að keyra á einni vél. Þetta þýðir að litlir og meðalstórir þróunaraðilar geta í fyrsta skipti fengið aðgang að líkani sem er nálægt GPT-5 stigi.

Raunverulega spurningin er ekki hvort Qwen 3.5 geti sigrað GPT-5.3, heldur: Hvernig græða AI fyrirtæki peninga þegar kostnaður við efstu líkön lækkar í næstum núll?

Published in Technology

You Might Also Like