Qwen 3.5 випущено: модель з відкритими вагами з 397B параметрами, вартість знижено на 60%

2/16/2026
3 min read

Alibaba щойно випустила Qwen 3.5-397B-A17B. Це перша модель з відкритими вагами з серії Qwen 3.5.

Ключові дані

  • Загальна кількість параметрів: 397B
  • Активні параметри: 17B per pass (розріджена MoE)
  • Пропускна здатність: у 8.6x-19x разів вища, ніж у Qwen 3-Max
  • Вартість: на 60% нижча, ніж у Qwen 3
  • Підтримка мов: 201 (розширено зі 119)

Це не просто накопичення параметрів. Це переосмислення ефективності.

Qwen 3.5

Архітектурні інновації

Qwen 3.5 використовує гібридну архітектуру:

  • Gated Delta Networks + розріджена MoE
  • Гібридна лінійна увага: більшість шарів використовують лінійну увагу, кожні 4 шари використовують повну увагу
  • Нативна мультимодальність: не додається пізніше, а навчається з нуля

У X є технічний аналіз:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Значення цієї архітектури полягає в тому, щоб: досягти продуктивності моделі, близької до 400B, з 17B активними параметрами. Вартість висновування значно знижується.

Заявлена продуктивність

Alibaba стверджує, що Qwen 3.5 перевершує:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Незалежні тестувальники в X почали перевірку:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Але найважливіше не еталонне тестування, а можливості агента:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Ера агентів

Позиціонування Qwen 3.5 чітке: розроблено для ери агентів.

  • Може аналізувати 2 години відео
  • Може самостійно виконувати завдання між програмами
  • Може розуміти GUI та взаємодіяти з ним

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Це означає, що це не «чат-бот», а «виконавець завдань».

Конкурентне середовище

Хтось у X підсумував випуски AI цього тижня:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Темп китайських виробників моделей зрозумілий:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Щотижня з'являються нові моделі, і кожна стверджує, що перевершує GPT. Це не маркетинг, це ескалація цінової війни.

Структура витрат

Ціна токена Qwen 3.5 становить лише 1/18 від ціни Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Коли продуктивність близька, а вартість становить лише 5%, де знаходиться рів закритої моделі?

Підсумок

Qwen 3.5 — це не «китайський GPT». Це руйнівник структури витрат:

  1. 397B параметрів, але активовано лише 17B
  2. Відкриті ваги, можна розгорнути локально
  3. Можливості агента, а не просто діалог
  4. Вартість становить лише 5% від вартості конкурентів

У X є цікавий прогноз:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225 ГБ відеопам'яті, можна запустити на одному комп'ютері. Це означає, що малі та середні розробники вперше зможуть отримати доступ до моделі, близької до GPT-5.

Справжнє питання не в тому, чи може Qwen 3.5 перемогти GPT-5.3, а в тому: як компанії, що займаються штучним інтелектом, зароблятимуть гроші, коли вартість топових моделей впаде майже до нуля?

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy зміни: як отримати блискучого легендарного улюбленця

Claude Code Buddy зміни: як отримати блискучого легендарного улюбленця 1 квітня 2026 року, Anthropic тихо запустила функ...

Obsidian випустив Defuddle, піднявши Obsidian Web Clipper на новий рівеньTechnology

Obsidian випустив Defuddle, піднявши Obsidian Web Clipper на новий рівень

Obsidian випустив Defuddle, піднявши Obsidian Web Clipper на новий рівень Я завжди любив основну ідею Obsidian: локальн...

OpenAI раптово оголосила про "три в одному": об'єднання браузера, програмування та ChatGPT, внутрішнє визнання помилок минулого рокуTechnology

OpenAI раптово оголосила про "три в одному": об'єднання браузера, програмування та ChatGPT, внутрішнє визнання помилок минулого року

OpenAI раптово оголосила про "три в одному": об'єднання браузера, програмування та ChatGPT, внутрішнє визнання помилок м...

2026, більше не змушуйте себе "дисциплінуватися"! Зробіть ці 8 простих справ, і здоров'я прийде природноHealth

2026, більше не змушуйте себе "дисциплінуватися"! Зробіть ці 8 простих справ, і здоров'я прийде природно

2026, більше не змушуйте себе "дисциплінуватися"! Зробіть ці 8 простих справ, і здоров'я прийде природно Новий рік почи...

Ті мами, які намагаються схуднути, але не можуть, безумовно, потрапляють сюдиHealth

Ті мами, які намагаються схуднути, але не можуть, безумовно, потрапляють сюди

Ті мами, які намагаються схуднути, але не можуть, безумовно, потрапляють сюди Травень вже минув, як ваш план схуднення?...

📝
Technology

AI Browser 24 години стабільної роботи: посібник

AI Browser 24 години стабільної роботи: посібник Цей посібник описує, як налаштувати стабільне, тривале середовище для A...