Qwen 3.5 Yayınlandı: 397B Parametreli Açık Ağırlıklı Model, %60 Daha Düşük Maliyet
Alibaba, Qwen 3.5-397B-A17B'yi yeni yayınladı. Bu, Qwen 3.5 serisinin ilk açık ağırlıklı modelidir.
Temel Veriler
- Toplam Parametre: 397B
- Aktif Parametre: Geçiş başına 17B (seyrek MoE)
- Verim: Qwen 3-Max'ten 8.6x-19x daha yüksek
- Maliyet: Qwen 3'ten %60 daha düşük
- Dil Desteği: 201 dil (119 dilden genişletildi)
Bu basit bir parametre yığını değil. Bu, verimliliğin yeniden tanımlanması.

Mimari Yenilikler
Qwen 3.5, karma bir mimari kullanır:
- Gated Delta Networks + Seyrek MoE
- Karma Doğrusal Dikkat: Katmanların çoğu doğrusal dikkat kullanır, her 4 katmanda bir tam dikkat kullanılır
- Yerel Çok Modlu: Sonradan eklenmedi, sıfırdan eğitildi
X'te teknik analiz var:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Bu mimarinin anlamı şudur: 17B aktif parametre ile 400B modele yakın performans elde etmek. Çıkarım maliyeti önemli ölçüde düşer.
Performans İddiaları
Alibaba, Qwen 3.5'in şunları yendiğini iddia ediyor:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
X'teki bağımsız testçiler doğrulamaya başladı:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Ancak en önemlisi kıyaslama testleri değil, ajan yeteneği:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Ajan Çağı
Qwen 3.5'in konumlandırması çok açık: Ajan çağı için tasarlandı.
- 2 saatlik videoları analiz edebilir
- Uygulamalar arası görevleri bağımsız olarak gerçekleştirebilir
- GUI'yi anlayabilir ve etkileşim kurabilir
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
Bu, onun bir "sohbet robotu" değil, bir "görev yürütücü" olduğu anlamına gelir.
Rekabet Ortamı
X'te biri bu haftaki AI yayınlarını özetledi:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Çinli model üreticilerinin ritmi çok açık:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Her hafta yeni bir model var ve her biri GPT'yi yendiğini iddia ediyor. Bu pazarlama değil, bu maliyet savaşının yükseltilmesi.
Maliyet Yapısı
Qwen 3.5'in token fiyatı, Gemini 3 Pro'nun sadece 1/18'i.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Performans yakın olduğunda ve maliyet sadece %5 olduğunda, kapalı kaynaklı modellerin hendekleri nerede?
Sonuç
Qwen 3.5 bir "Çin GPT'si" değil. Bu, maliyet yapısının yıkıcısı:
- 397B parametre, ancak sadece 17B'yi etkinleştirir
- Açık ağırlıklar, yerel olarak konuşlandırılabilir
- Ajan yeteneği, sadece diyalog değil
- Maliyet rakiplerinin sadece %5'i
X'te ilginç bir tahmin var:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
225GB ekran kartı belleği, tek makinede çalıştırılabilir. Bu, küçük ve orta ölçekli geliştiricilerin ilk kez GPT-5 seviyesine yakın bir modele erişebileceği anlamına gelir.
Asıl soru Qwen 3.5'in GPT-5.3'ü yenip yenemeyeceği değil, şu: En iyi modellerin maliyeti sıfıra yakın olduğunda, AI şirketleri nasıl para kazanacak?





