Qwen 3.5 Wydany: Model z Otwartymi Wagami o 397B Parametrach, Koszt Zredukowany o 60%
Alibaba właśnie wydała Qwen 3.5-397B-A17B. Jest to pierwszy model z otwartymi wagami z serii Qwen 3.5.
Kluczowe dane
- Całkowita liczba parametrów: 397B
- Aktywne parametry: 17B per pass (rzadkie MoE)
- Przepustowość: 8.6x-19x wyższa niż Qwen 3-Max
- Koszt: 60% niższy niż Qwen 3
- Obsługa języków: 201 (rozszerzone z 119)
To nie jest proste nakładanie parametrów. To jest redefinicja efektywności.

Innowacje w architekturze
Qwen 3.5 wykorzystuje hybrydową architekturę:
- Gated Delta Networks + rzadkie MoE
- Hybrydowa liniowa uwaga: większość warstw używa liniowej uwagi, co 4 warstwy używają pełnej uwagi
- Natywna multimodalność: nie dodawana później, ale trenowana od podstaw
Na X jest analiza techniczna:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Znaczenie tej architektury polega na: osiągnięciu wydajności zbliżonej do modelu 400B przy użyciu 17B aktywnych parametrów. Koszt wnioskowania znacznie spada.
Deklaracje wydajności
Alibaba twierdzi, że Qwen 3.5 pokonał:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
Niezależni testerzy na X zaczynają weryfikować:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Ale najważniejsze nie są testy porównawcze, ale zdolności agenta:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Era agentów
Pozycjonowanie Qwen 3.5 jest jasne: zaprojektowany dla ery agentów.
- Może analizować 2-godzinne wideo
- Może samodzielnie wykonywać zadania w różnych aplikacjach
- Może rozumieć GUI i wchodzić z nim w interakcje
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
Oznacza to, że nie jest to „chatbot”, ale „wykonawca zadań”.
Krajobraz konkurencji
Ktoś na X podsumował wydania AI w tym tygodniu:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Rytm chińskich producentów modeli jest jasny:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Nowe modele co tydzień, każdy twierdzi, że pokonał GPT. To nie jest marketing, to jest eskalacja wojny kosztowej.
Struktura kosztów
Cena tokena Qwen 3.5 to tylko 1/18 ceny Gemini 3 Pro.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Gdzie jest fosa modeli zamkniętych, gdy wydajność jest zbliżona, a koszt to tylko 5%?
Podsumowanie
Qwen 3.5 to nie jest „chiński GPT”. To jest zakłócacz struktury kosztów:
- 397B parametrów, ale tylko 17B aktywowanych
- Otwarte wagi, możliwość lokalnego wdrożenia
- Zdolności agenta, nie tylko dialog
- Koszt to tylko 5% konkurencji
Na X jest interesująca prognoza:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
225 GB pamięci VRAM, można uruchomić na jednym komputerze. Oznacza to, że drobni i średni deweloperzy po raz pierwszy mają dostęp do modelu zbliżonego do GPT-5.
Prawdziwe pytanie nie brzmi, czy Qwen 3.5 może pokonać GPT-5.3, ale: jak firmy AI zarabiają, gdy koszt najlepszych modeli spada do zera?





