Qwen 3.5 Publikohet: Model me Pesha të Hapura me 397B Parametra, Kosto e Reduktuar me 60%
Alibaba sapo ka publikuar Qwen 3.5-397B-A17B. Ky është modeli i parë me pesha të hapura i serisë Qwen 3.5.
Të dhëna Kryesore
- Parametra Gjithsej: 397B
- Parametra Aktivë: 17B për kalim (MoE i rrallë)
- Përpunimi: 8.6x-19x më i lartë se Qwen 3-Max
- Kosto: 60% më e ulët se Qwen 3
- Mbështetje Gjuhësore: 201 gjuhë (zgjeruar nga 119 gjuhë)
Ky nuk është thjesht grumbullim parametrash. Ky është ripërcaktim i efikasitetit.

Inovacione Arkitekturore
Qwen 3.5 përdor një arkitekturë të përzier:
- Gated Delta Networks + MoE i rrallë
- Vëmendje Lineare e Përzier: Shumica e shtresave përdorin vëmendje lineare, çdo 4 shtresa përdorin vëmendje të plotë
- Multimodale Native: Nuk është shtuar më vonë, por është trajnuar nga e para
Ka analiza teknike në X:
\





