Qwen 3.5 Wydany: Model z Otwartymi Wagami o 397B Parametrach, Koszt Zredukowany o 60%

Alibaba właśnie wydała Qwen 3.5-397B-A17B. Jest to pierwszy model z otwartymi wagami z serii Qwen 3.5.

Kluczowe dane

Całkowita liczba parametrów: 397B
Aktywne parametry: 17B per pass (rzadkie MoE)
Przepustowość: 8.6x-19x wyższa niż Qwen 3-Max
Koszt: 60% niższy niż Qwen 3
Obsługa języków: 201 (rozszerzone z 119)

To nie jest proste nakładanie parametrów. To jest redefinicja efektywności.

Qwen 3.5

Innowacje w architekturze

Qwen 3.5 wykorzystuje hybrydową architekturę:

Gated Delta Networks + rzadkie MoE
Hybrydowa liniowa uwaga: większość warstw używa liniowej uwagi, co 4 warstwy używają pełnej uwagi
Natywna multimodalność: nie dodawana później, ale trenowana od podstaw

Na X jest analiza techniczna:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Znaczenie tej architektury polega na: osiągnięciu wydajności zbliżonej do modelu 400B przy użyciu 17B aktywnych parametrów. Koszt wnioskowania znacznie spada.

Deklaracje wydajności

Alibaba twierdzi, że Qwen 3.5 pokonał:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

Niezależni testerzy na X zaczynają weryfikować:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Ale najważniejsze nie są testy porównawcze, ale zdolności agenta:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Era agentów

Pozycjonowanie Qwen 3.5 jest jasne: zaprojektowany dla ery agentów.

Może analizować 2-godzinne wideo
Może samodzielnie wykonywać zadania w różnych aplikacjach
Może rozumieć GUI i wchodzić z nim w interakcje

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Oznacza to, że nie jest to „chatbot”, ale „wykonawca zadań”.

Krajobraz konkurencji

Ktoś na X podsumował wydania AI w tym tygodniu:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Rytm chińskich producentów modeli jest jasny:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

Nowe modele co tydzień, każdy twierdzi, że pokonał GPT. To nie jest marketing, to jest eskalacja wojny kosztowej.

Struktura kosztów

Cena tokena Qwen 3.5 to tylko 1/18 ceny Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Gdzie jest fosa modeli zamkniętych, gdy wydajność jest zbliżona, a koszt to tylko 5%?

Podsumowanie

Qwen 3.5 to nie jest „chiński GPT”. To jest zakłócacz struktury kosztów:

397B parametrów, ale tylko 17B aktywowanych
Otwarte wagi, możliwość lokalnego wdrożenia
Zdolności agenta, nie tylko dialog
Koszt to tylko 5% konkurencji

Na X jest interesująca prognoza:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

225 GB pamięci VRAM, można uruchomić na jednym komputerze. Oznacza to, że drobni i średni deweloperzy po raz pierwszy mają dostęp do modelu zbliżonego do GPT-5.

Prawdziwe pytanie nie brzmi, czy Qwen 3.5 może pokonać GPT-5.3, ale: jak firmy AI zarabiają, gdy koszt najlepszych modeli spada do zera?

Qwen 3.5 Wydany: Model z Otwartymi Wagami o 397B Parametrach, Koszt Zredukowany o 60%

Kluczowe dane

Innowacje w architekturze

Deklaracje wydajności

Era agentów

Krajobraz konkurencji

Struktura kosztów

Podsumowanie

You Might Also Like

Claude Code Buddy 修改指南：如何获得闪光传说级宠物

Obsidian wprowadził Defuddle, podnosząc Obsidian Web Clipper na nowy poziom

OpenAI nagle ogłasza "trzy w jednym": połączenie przeglądarki + programowania + ChatGPT, wewnętrznie przyznaje, że w ciągu ostatniego roku popełniło błąd

2026, nie zmuszaj się do 'dyscypliny'! Zrób te 8 małych rzeczy, a zdrowie przyjdzie naturalnie

Te mamy, które ciężko pracują nad odchudzaniem, ale nie mogą schudnąć, na pewno mają problem tutaj

AI Browser 24小时稳定运行指南