Qwen 3.5 išleistas: 397B parametrų atvirojo svorio modelis, 60% mažesnė kaina

2/16/2026
3 min read

Alibaba ką tik išleido Qwen 3.5-397B-A17B. Tai yra pirmasis Qwen 3.5 serijos atvirojo svorio modelis.

Pagrindiniai duomenys

  • Bendras parametrų skaičius: 397B
  • Aktyvūs parametrai: 17B per pass (retas MoE)
  • Pralaidumas: 8.6x-19x didesnis nei Qwen 3-Max
  • Kaina: 60% mažesnė nei Qwen 3
  • Kalbos palaikymas: 201 (išplėstas nuo 119)

Tai nėra paprastas parametrų sukrovimas. Tai yra efektyvumo apibrėžimas iš naujo.

Qwen 3.5

Architektūros inovacijos

Qwen 3.5 naudoja hibridinę architektūrą:

  • Gated Delta Networks + retas MoE
  • Hibridinis linijinis dėmesys: dauguma sluoksnių naudoja linijinį dėmesį, kas 4 sluoksniai naudoja pilną dėmesį
  • Gimtoji daugiarūšė: ne pridėta vėliau, o apmokyta nuo pat pradžių

X yra techninė analizė:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Šios architektūros reikšmė yra: su 17B aktyvių parametrų pasiekti beveik 400B modelio našumą. Išvadų darymo kaina labai sumažėja.

Našumo teiginiai

Alibaba teigia, kad Qwen 3.5 nugalėjo:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

X nepriklausomi testuotojai pradeda tikrinti:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Tačiau svarbiausia yra ne lyginamieji testai, o agento galimybės:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Agento era

Qwen 3.5 pozicionavimas yra aiškus: sukurtas agento erai.

  • Gali analizuoti 2 valandų vaizdo įrašus
  • Gali savarankiškai vykdyti užduotis tarp programų
  • Gali suprasti GUI ir su juo sąveikauti

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Tai reiškia, kad tai nėra „pokalbių robotas“, o „užduočių vykdytojas“.

Konkurencinė aplinka

X kažkas apibendrino šios savaitės AI leidimus:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Kinijos modelių gamintojų ritmas yra aiškus:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Kiekvieną savaitę pasirodo naujas modelis, ir kiekvieną kartą teigiama, kad jis nugalėjo GPT. Tai nėra rinkodara, tai yra išlaidų karo eskalavimas.

Išlaidų struktūra

Qwen 3.5 tokenų kaina yra tik 1/18 Gemini 3 Pro kainos.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Kai našumas yra panašus, o kaina tik 5%, kur yra uždaro kodo modelių gynybinė siena?

Esmė

Qwen 3.5 nėra „Kinijos GPT“. Tai yra išlaidų struktūros ardytojas:

  1. 397B parametrai, bet aktyvuojama tik 17B
  2. Atviri svoriai, galima diegti vietoje
  3. Agento galimybės, ne tik dialogas
  4. Kaina tik 5% konkurentų kainos

X yra įdomi prognozė:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225 GB vaizdo atminties, galima paleisti viename kompiuteryje. Tai reiškia, kad maži ir vidutiniai kūrėjai pirmą kartą gali susipažinti su modeliu, kuris yra artimas GPT-5 lygiui.

Tikrasis klausimas yra ne tai, ar Qwen 3.5 gali nugalėti GPT-5.3, o tai: kaip AI įmonės uždirba pinigus, kai aukščiausio lygio modelių kaina sumažėja beveik iki nulio?

Published in Technology

You Might Also Like