Qwen 3.5 випущено: модель з відкритими вагами з 397B параметрами, вартість знижено на 60%
Alibaba щойно випустила Qwen 3.5-397B-A17B. Це перша модель з відкритими вагами з серії Qwen 3.5.
Ключові дані
- Загальна кількість параметрів: 397B
- Активні параметри: 17B per pass (розріджена MoE)
- Пропускна здатність: у 8.6x-19x разів вища, ніж у Qwen 3-Max
- Вартість: на 60% нижча, ніж у Qwen 3
- Підтримка мов: 201 (розширено зі 119)
Це не просто накопичення параметрів. Це переосмислення ефективності.

Архітектурні інновації
Qwen 3.5 використовує гібридну архітектуру:
- Gated Delta Networks + розріджена MoE
- Гібридна лінійна увага: більшість шарів використовують лінійну увагу, кожні 4 шари використовують повну увагу
- Нативна мультимодальність: не додається пізніше, а навчається з нуля
У X є технічний аналіз:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Значення цієї архітектури полягає в тому, щоб: досягти продуктивності моделі, близької до 400B, з 17B активними параметрами. Вартість висновування значно знижується.
Заявлена продуктивність
Alibaba стверджує, що Qwen 3.5 перевершує:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
Незалежні тестувальники в X почали перевірку:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Але найважливіше не еталонне тестування, а можливості агента:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Ера агентів
Позиціонування Qwen 3.5 чітке: розроблено для ери агентів.
- Може аналізувати 2 години відео
- Може самостійно виконувати завдання між програмами
- Може розуміти GUI та взаємодіяти з ним
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
Це означає, що це не «чат-бот», а «виконавець завдань».
Конкурентне середовище
Хтось у X підсумував випуски AI цього тижня:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Темп китайських виробників моделей зрозумілий:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Щотижня з'являються нові моделі, і кожна стверджує, що перевершує GPT. Це не маркетинг, це ескалація цінової війни.
Структура витрат
Ціна токена Qwen 3.5 становить лише 1/18 від ціни Gemini 3 Pro.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Коли продуктивність близька, а вартість становить лише 5%, де знаходиться рів закритої моделі?
Підсумок
Qwen 3.5 — це не «китайський GPT». Це руйнівник структури витрат:
- 397B параметрів, але активовано лише 17B
- Відкриті ваги, можна розгорнути локально
- Можливості агента, а не просто діалог
- Вартість становить лише 5% від вартості конкурентів
У X є цікавий прогноз:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
225 ГБ відеопам'яті, можна запустити на одному комп'ютері. Це означає, що малі та середні розробники вперше зможуть отримати доступ до моделі, близької до GPT-5.
Справжнє питання не в тому, чи може Qwen 3.5 перемогти GPT-5.3, а в тому: як компанії, що займаються штучним інтелектом, зароблятимуть гроші, коли вартість топових моделей впаде майже до нуля?





