Qwen 3.5 выпущен: модель с открытым весом и 397B параметрами, стоимость снижена на 60%
Alibaba только что выпустила Qwen 3.5-397B-A17B. Это первая модель с открытым весом из серии Qwen 3.5.
Ключевые данные
- Общее количество параметров: 397B
- Активные параметры: 17B per pass (разреженная MoE)
- Пропускная способность: в 8.6x-19x раз выше, чем у Qwen 3-Max
- Стоимость: на 60% ниже, чем у Qwen 3
- Поддержка языков: 201 (расширена с 119)
Это не простое наращивание параметров. Это переосмысление эффективности.

Архитектурные инновации
Qwen 3.5 использует гибридную архитектуру:
- Gated Delta Networks + разреженная MoE
- Гибридное линейное внимание: большинство слоев используют линейное внимание, каждый 4-й слой использует полное внимание
- Нативная мультимодальность: не добавляется позже, а обучается с нуля
В X есть технический анализ:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Смысл этой архитектуры в том, чтобы: достичь производительности модели, близкой к 400B, с 17B активных параметров. Стоимость инференса значительно снижается.
Заявленная производительность
Alibaba утверждает, что Qwen 3.5 превзошла:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
Независимые тестировщики в X начали проверку:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Но самое главное - не бенчмарки, а агентские возможности:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Эпоха агентов
Позиционирование Qwen 3.5 очень четкое: разработана для эпохи агентов.
- Может анализировать 2-часовое видео
- Может самостоятельно выполнять задачи между приложениями
- Может понимать GUI и взаимодействовать с ним
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
Это означает, что это не «чат-бот», а «исполнитель задач».
Конкурентная среда
В X кто-то подытожил выпуски AI на этой неделе:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Ритм китайских производителей моделей очень ясен:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Каждую неделю появляется новая модель, и каждый раз утверждается, что она превосходит GPT. Это не маркетинг, это эскалация ценовой войны.
Структура затрат
Цена токена Qwen 3.5 составляет всего 1/18 от цены Gemini 3 Pro.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Когда производительность близка, а стоимость составляет всего 5%, где находится крепость закрытых моделей?
Итог
Qwen 3.5 - это не «китайский GPT». Это разрушитель структуры затрат:
- 397B параметров, но активируется только 17B
- Открытый вес, можно развернуть локально
- Агентские возможности, а не просто диалог
- Стоимость составляет всего 5% от стоимости конкурентов
В X есть интересный прогноз:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
225GB видеопамяти, можно запустить на одном компьютере. Это означает, что малые и средние разработчики впервые смогут получить доступ к модели, близкой к уровню GPT-5.
Настоящий вопрос не в том, сможет ли Qwen 3.5 превзойти GPT-5.3, а в том: как AI-компании будут зарабатывать деньги, когда стоимость топовых моделей упадет почти до нуля?





