Qwen 3.5 Издаден: Модел с отворени тегла с 397B параметри, 60% намаление на разходите
Alibaba току-що пусна Qwen 3.5-397B-A17B. Това е първият модел с отворени тегла от серията Qwen 3.5.
Основни данни
- Общ брой параметри: 397B
- Активирани параметри: 17B на преминаване (разреден MoE)
- Производителност: 8.6x-19x подобрение спрямо Qwen 3-Max
- Разходи: 60% намаление спрямо Qwen 3
- Поддръжка на езици: 201 (разширено от 119)
Това не е просто натрупване на параметри. Това е предефиниране на ефективността.

Архитектурни иновации
Qwen 3.5 използва хибридна архитектура:
- Gated Delta Networks + разреден MoE
- Хибридно линейно внимание: повечето слоеве използват линейно внимание, на всеки 4 слоя се използва пълно внимание
- Естествена мултимодалност: не е добавена по-късно, а е обучена от нулата
Има технически анализ в X:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Значението на тази архитектура е: да се постигне производителност, близка до 400B модел, с 17B активирани параметри. Разходите за извод са значително намалени.
Изявления за производителност
Alibaba твърди, че Qwen 3.5 е победил:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
Независими тестери в X започнаха да проверяват:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Но най-важното не са бенчмарковете, а агентните възможности:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Ерата на агентите
Позиционирането на Qwen 3.5 е ясно: проектиран за ерата на агентите.
- Може да анализира 2-часови видеоклипове
- Може самостоятелно да изпълнява задачи в различни приложения
- Може да разбира GUI и да взаимодейства с тях
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
Това означава, че не е „чатбот“, а „изпълнител на задачи“.
Конкурентна среда
Някой в X обобщи AI изданията тази седмица:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Ритъмът на китайските производители на модели е ясен:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Всяка седмица има нов модел и всеки път се твърди, че е победил GPT. Това не е маркетинг, това е ескалация на ценовата война.
Структура на разходите
Цената на токените на Qwen 3.5 е само 1/18 от тази на Gemini 3 Pro.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Когато производителността е близка, а разходите са само 5%, къде е защитната стена на затворените модели?
Заключение
Qwen 3.5 не е „китайски GPT“. Той е нарушител на структурата на разходите:
- 397B параметри, но само 17B са активирани
- Отворени тегла, могат да бъдат разположени локално
- Агентни възможности, не само диалог
- Разходите са само 5% от тези на конкурентите
Има интересна прогноза в X:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
Необходими са 225GB VRAM, може да се изпълнява на една машина. Това означава, че малките и средни разработчици за първи път могат да имат достъп до модел, близък до нивото на GPT-5.
Истинският въпрос не е дали Qwen 3.5 може да победи GPT-5.3, а: как AI компаниите ще печелят пари, когато цената на най-добрите модели падне почти до нула?





