Qwen 3.5 Објављен: Отворени модел тежине са 397B параметара, 60% смањење трошкова

2/16/2026
3 min read

Алибаба је управо објавила Qwen 3.5-397B-A17B. Ово је први модел отворене тежине из серије Qwen 3.5.

Кључни подаци

  • Укупни параметри: 397B
  • Активни параметри: 17B per pass (sparse MoE)
  • Пропусност: 8.6x-19x побољшање у односу на Qwen 3-Max
  • Трошкови: 60% смањење у односу на Qwen 3
  • Подршка за језике: 201 (проширено са 119)

Ово није једноставно слагање параметара. Ово је редефинисање ефикасности.

Qwen 3.5

Архитектонске иновације

Qwen 3.5 користи хибридну архитектуру:

  • Gated Delta Networks + sparse MoE
  • Хибридна линеарна пажња: Већина слојева користи линеарну пажњу, сваки 4. слој користи пуну пажњу
  • Изворна мултимодалност: Није накнадно додата, већ је тренирана од почетка

На X-у постоји техничка анализа:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Значење ове архитектуре је: постизање перформанси модела од скоро 400B са 17B активних параметара. Трошкови закључивања су значајно смањени.

Тврдње о перформансама

Алибаба тврди да је Qwen 3.5 победио:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Независни тестери на X-у су почели да верификују:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Али најважније нису бенчмарк тестови, већ агентске способности:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Агентска ера

Позиционирање Qwen 3.5 је јасно: дизајниран за агентску еру.

  • Може да анализира 2 сата видеа
  • Може самостално да извршава задатке у различитим апликацијама
  • Може да разуме GUI и да комуницира са њим

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

То значи да није „цхатбот“, већ „извршитељ задатака“.

Конкурентски пејзаж

Неко је на X-у сумирао AI објаве ове недеље:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Ритам кинеских произвођача модела је јасан:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Сваке недеље постоји нови модел, и сваки пут тврде да су победили GPT. Ово није маркетинг, ово је ескалација рата трошкова.

Структура трошкова

Цена токена Qwen 3.5 је само 1/18 цене Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Када су перформансе сличне, а трошкови само 5%, где је ров затворених модела?

Закључак

Qwen 3.5 није „кинески GPT“. То је реметилац структуре трошкова:

  1. 397B параметара, али се активира само 17B
  2. Отворена тежина, може се локално распоредити
  3. Агентске способности, не само дијалог
  4. Трошкови су само 5% трошкова конкуренције

На X-у постоји занимљива прогноза:

"Qwen 3.5 Q4 верзија захтева само 225G, што је веома практично" — @janxin

225GB видео меморије, може да се покрене на једном рачунару. То значи да мали и средњи програмери први пут могу да приступе моделу блиском GPT-5 нивоу.

Право питање није да ли Qwen 3.5 може да победи GPT-5.3, већ: како AI компаније зарађују када се трошкови врхунских модела смање на скоро нулу?

Published in Technology

You Might Also Like