Qwen 3.5 випущено: модель з відкритими вагами з 397B параметрами, вартість знижено на 60%

2/16/2026
3 min read

Alibaba щойно випустила Qwen 3.5-397B-A17B. Це перша модель з відкритими вагами з серії Qwen 3.5.

Ключові дані

  • Загальна кількість параметрів: 397B
  • Активні параметри: 17B per pass (розріджена MoE)
  • Пропускна здатність: у 8.6x-19x разів вища, ніж у Qwen 3-Max
  • Вартість: на 60% нижча, ніж у Qwen 3
  • Підтримка мов: 201 (розширено зі 119)

Це не просто накопичення параметрів. Це переосмислення ефективності.

Qwen 3.5

Архітектурні інновації

Qwen 3.5 використовує гібридну архітектуру:

  • Gated Delta Networks + розріджена MoE
  • Гібридна лінійна увага: більшість шарів використовують лінійну увагу, кожні 4 шари використовують повну увагу
  • Нативна мультимодальність: не додається пізніше, а навчається з нуля

У X є технічний аналіз:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Значення цієї архітектури полягає в тому, щоб: досягти продуктивності моделі, близької до 400B, з 17B активними параметрами. Вартість висновування значно знижується.

Заявлена продуктивність

Alibaba стверджує, що Qwen 3.5 перевершує:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Незалежні тестувальники в X почали перевірку:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Але найважливіше не еталонне тестування, а можливості агента:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Ера агентів

Позиціонування Qwen 3.5 чітке: розроблено для ери агентів.

  • Може аналізувати 2 години відео
  • Може самостійно виконувати завдання між програмами
  • Може розуміти GUI та взаємодіяти з ним

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Це означає, що це не «чат-бот», а «виконавець завдань».

Конкурентне середовище

Хтось у X підсумував випуски AI цього тижня:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Темп китайських виробників моделей зрозумілий:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Щотижня з'являються нові моделі, і кожна стверджує, що перевершує GPT. Це не маркетинг, це ескалація цінової війни.

Структура витрат

Ціна токена Qwen 3.5 становить лише 1/18 від ціни Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Коли продуктивність близька, а вартість становить лише 5%, де знаходиться рів закритої моделі?

Підсумок

Qwen 3.5 — це не «китайський GPT». Це руйнівник структури витрат:

  1. 397B параметрів, але активовано лише 17B
  2. Відкриті ваги, можна розгорнути локально
  3. Можливості агента, а не просто діалог
  4. Вартість становить лише 5% від вартості конкурентів

У X є цікавий прогноз:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225 ГБ відеопам'яті, можна запустити на одному комп'ютері. Це означає, що малі та середні розробники вперше зможуть отримати доступ до моделі, близької до GPT-5.

Справжнє питання не в тому, чи може Qwen 3.5 перемогти GPT-5.3, а в тому: як компанії, що займаються штучним інтелектом, зароблятимуть гроші, коли вартість топових моделей впаде майже до нуля?

Published in Technology

You Might Also Like

Як використовувати технології хмарних обчислень: повний посібник зі створення вашої першої хмарної інфраструктуриTechnology

Як використовувати технології хмарних обчислень: повний посібник зі створення вашої першої хмарної інфраструктури

Як використовувати технології хмарних обчислень: повний посібник зі створення вашої першої хмарної інфраструктури Вступ ...

Попередження! Батько Claude Code прямо заявляє: через місяць без Plan Mode титул програміста зникнеTechnology

Попередження! Батько Claude Code прямо заявляє: через місяць без Plan Mode титул програміста зникне

Попередження! Батько Claude Code прямо заявляє: через місяць без Plan Mode титул програміста зникне Нещодавно в YC відб...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026 рік Топ 10 AI агентів: аналіз основних перевагTechnology

2026 рік Топ 10 AI агентів: аналіз основних переваг

2026 рік Топ 10 AI агентів: аналіз основних переваг Вступ З розвитком штучного інтелекту AI агенти стали гарячою темою у...

Рекомендації топ-10 AI інструментів 2026 року: розкриття справжнього потенціалу штучного інтелектуTechnology

Рекомендації топ-10 AI інструментів 2026 року: розкриття справжнього потенціалу штучного інтелекту

Рекомендації топ-10 AI інструментів 2026 року: розкриття справжнього потенціалу штучного інтелекту У часи швидкого розви...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 У швидко розвиваючійся сфері хмарних обчислень Amazon Web Services (AWS) завжди була лідером, пр...