Објавен Qwen 3.5: Модел со отворена тежина со 397B параметри, 60% намалување на трошоците
Алибаба штотуку го објави Qwen 3.5-397B-A17B. Ова е првиот модел со отворена тежина од серијата Qwen 3.5.
Клучни податоци
- Вкупни параметри: 397B
- Активни параметри: 17B per pass (редок MoE)
- Пропусност: 8.6x-19x подобрување во однос на Qwen 3-Max
- Трошоци: 60% намалување во однос на Qwen 3
- Поддршка за јазици: 201 (проширено од 119)
Ова не е едноставно натрупување на параметри. Ова е редефинирање на ефикасноста.

Архитектонски иновации
Qwen 3.5 користи хибридна архитектура:
- Gated Delta Networks + редок MoE
- Хибридно линеарно внимание: Повеќето слоеви користат линеарно внимание, на секои 4 слоеви се користи целосно внимание
- Нативно мултимодално: Не е додадено подоцна, туку е тренирано од почеток
Има техничка анализа на X:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Значењето на оваа архитектура е: да се постигне перформанса на модел од речиси 400B со 17B активни параметри. Трошоците за заклучување се значително намалени.
Тврдења за перформанси
Алибаба тврди дека Qwen 3.5 ги победи:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
Независни тестери на X почнаа да проверуваат:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Но, најважно не е тестирањето, туку агентската способност:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Ера на агенти
Позиционирањето на Qwen 3.5 е јасно: дизајниран за ерата на агенти.
- Може да анализира 2 часа видео
- Може самостојно да извршува задачи низ апликации
- Може да разбере GUI и да комуницира со него
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
Ова значи дека не е „четбот“, туку „извршител на задачи“.
Конкурентска средина
Некој на X ги сумираше AI објавите оваа недела:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Ритам на кинеските производители на модели е јасен:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Секоја недела има нови модели, и секој пат тврдат дека го победиле GPT. Ова не е маркетинг, ова е ескалација на војната на трошоци.
Структура на трошоци
Цената на токен на Qwen 3.5 е само 1/18 од Gemini 3 Pro.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Кога перформансите се блиску, а трошоците се само 5%, каде е ровот на затворените модели?
Заклучок
Qwen 3.5 не е „кинески GPT“. Тој е нарушувач на структурата на трошоци:
- 397B параметри, но само 17B се активираат
- Отворена тежина, може да се распореди локално
- Агентска способност, не само дијалог
- Трошоците се само 5% од конкурентите
Има интересна прогноза на X:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
225GB VRAM, може да се изврши на еден компјутер. Ова значи дека малите и средни програмери за прв пат можат да пристапат до модел блиску до нивото на GPT-5.
Вистинското прашање не е дали Qwen 3.5 може да го победи GPT-5.3, туку: како компаниите за вештачка интелигенција заработуваат пари кога трошоците за врвните модели се намалуваат на речиси нула?





