Qwen 3.5 ಬಿಡುಗಡೆ: 397B ನಿಯತಾಂಕಗಳ ತೆರೆದ ತೂಕದ ಮಾದರಿ, ವೆಚ್ಚದಲ್ಲಿ 60% ಇಳಿಕೆ
ಅಲಿಬಾಬಾ ಈಗಷ್ಟೇ Qwen 3.5-397B-A17B ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದೆ. ಇದು Qwen 3.5 ಸರಣಿಯ ಮೊದಲ ತೆರೆದ ತೂಕದ ಮಾದರಿಯಾಗಿದೆ.
ಪ್ರಮುಖ ದತ್ತಾಂಶ
- ಒಟ್ಟು ನಿಯತಾಂಕಗಳು: 397B
- ಸಕ್ರಿಯ ನಿಯತಾಂಕಗಳು: 17B ಪ್ರತಿ ಪಾಸ್ಗೆ (ವಿರಳ MoE)
- ಥ್ರೋಪುಟ್: Qwen 3-Max ಗಿಂತ 8.6x-19x ಹೆಚ್ಚಳ
- ವೆಚ್ಚ: Qwen 3 ಗಿಂತ 60% ಕಡಿಮೆ
- ಭಾಷಾ ಬೆಂಬಲ: 201 ವಿಧಗಳು (119 ವಿಧಗಳಿಂದ ವಿಸ್ತರಿಸಲಾಗಿದೆ)
ಇದು ಸರಳವಾದ ನಿಯತಾಂಕಗಳ ಜೋಡಣೆಯಲ್ಲ. ಇದು ದಕ್ಷತೆಯ ಮರು ವ್ಯಾಖ್ಯಾನ.

ವಾಸ್ತುಶಿಲ್ಪದ ನಾವೀನ್ಯತೆ
Qwen 3.5 ಮಿಶ್ರ ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ಬಳಸುತ್ತದೆ:
- Gated Delta Networks + ವಿರಳ MoE
- ಮಿಶ್ರ ರೇಖೀಯ ಗಮನ: ಹೆಚ್ಚಿನ ಪದರಗಳು ರೇಖೀಯ ಗಮನವನ್ನು ಬಳಸುತ್ತವೆ, ಪ್ರತಿ 4 ಪದರಗಳು ಪೂರ್ಣ ಗಮನವನ್ನು ಬಳಸುತ್ತವೆ
- ಸ್ಥಳೀಯ ಬಹು ಮಾದರಿ: ನಂತರ ಸೇರಿಸಲಾಗಿಲ್ಲ, ಆದರೆ ಮೊದಲಿನಿಂದ ತರಬೇತಿ ನೀಡಲಾಗಿದೆ
X ನಲ್ಲಿ ತಾಂತ್ರಿಕ ವಿಶ್ಲೇಷಣೆ ಇದೆ:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
ಈ ವಾಸ್ತುಶಿಲ್ಪದ ಅರ್ಥವೇನೆಂದರೆ: 17B ಸಕ್ರಿಯ ನಿಯತಾಂಕಗಳೊಂದಿಗೆ 400B ಮಾದರಿಯ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಸಾಧಿಸುವುದು. ಅನುಮಾನದ ವೆಚ್ಚವು ಗಣನೀಯವಾಗಿ ಕಡಿಮೆಯಾಗಿದೆ.
ಕಾರ್ಯಕ್ಷಮತೆಯ ಹೇಳಿಕೆ
Qwen 3.5 ಸೋಲಿಸಿದೆ ಎಂದು ಅಲಿಬಾಬಾ ಹೇಳಿಕೊಂಡಿದೆ:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
X ನಲ್ಲಿ ಸ್ವತಂತ್ರ ಪರೀಕ್ಷಕರು ಪರಿಶೀಲಿಸಲು ಪ್ರಾರಂಭಿಸಿದ್ದಾರೆ:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
ಆದರೆ ಅತ್ಯಂತ ನಿರ್ಣಾಯಕವಾದುದು ಮಾನದಂಡ ಪರೀಕ್ಷೆಯಲ್ಲ, ಆದರೆ ಏಜೆಂಟ್ ಸಾಮರ್ಥ್ಯ:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
ಏಜೆಂಟ್ ಯುಗ
Qwen 3.5 ರ ಸ್ಥಾನೀಕರಣವು ಸ್ಪಷ್ಟವಾಗಿದೆ: ಏಜೆಂಟ್ ಯುಗಕ್ಕಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ.
- 2 ಗಂಟೆಗಳ ವೀಡಿಯೊವನ್ನು ವಿಶ್ಲೇಷಿಸಬಹುದು
- ಅಪ್ಲಿಕೇಶನ್ಗಳಾದ್ಯಂತ ಸ್ವತಂತ್ರವಾಗಿ ಕಾರ್ಯಗಳನ್ನು ನಿರ್ವಹಿಸಬಹುದು
- GUI ಅನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬಹುದು ಮತ್ತು ಅದರೊಂದಿಗೆ ಸಂವಹನ ನಡೆಸಬಹುದು
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
ಇದರರ್ಥ ಇದು "ಚಾಟ್ಬಾಟ್" ಅಲ್ಲ, ಆದರೆ "ಕಾರ್ಯ ನಿರ್ವಾಹಕ".
ಸ್ಪರ್ಧಾತ್ಮಕ ಭೂದೃಶ್ಯ
X ನಲ್ಲಿ ಈ ವಾರದ AI ಬಿಡುಗಡೆಗಳನ್ನು ಯಾರೋ ಸಂಕ್ಷಿಪ್ತಗೊಳಿಸಿದ್ದಾರೆ:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
ಚೀನಾದ ಮಾದರಿ ತಯಾರಕರ ಲಯವು ಸ್ಪಷ್ಟವಾಗಿದೆ:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
ಪ್ರತಿ ವಾರ ಹೊಸ ಮಾದರಿಗಳು ಇರುತ್ತವೆ, ಪ್ರತಿಯೊಂದೂ GPT ಅನ್ನು ಸೋಲಿಸಿದೆ ಎಂದು ಹೇಳಿಕೊಳ್ಳುತ್ತದೆ. ಇದು ಮಾರ್ಕೆಟಿಂಗ್ ಅಲ್ಲ, ಇದು ವೆಚ್ಚದ ಯುದ್ಧದ ಉಲ್ಬಣ.
ವೆಚ್ಚದ ರಚನೆ
Qwen 3.5 ರ ಟೋಕನ್ ಬೆಲೆ Gemini 3 Pro ನ 1/18 ಮಾತ್ರ.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
ಕಾರ್ಯಕ್ಷಮತೆ ಹತ್ತಿರವಾದಾಗ ಮತ್ತು ವೆಚ್ಚವು ಕೇವಲ 5% ಆಗಿರುವಾಗ, ಮುಚ್ಚಿದ ಮೂಲ ಮಾದರಿಗಳ ರಕ್ಷಣಾತ್ಮಕ ಗೋಡೆ ಎಲ್ಲಿದೆ?
ಬಾಟಮ್ ಲೈನ್
Qwen 3.5 "ಚೀನಾದ GPT" ಅಲ್ಲ. ಇದು ವೆಚ್ಚದ ರಚನೆಯನ್ನು ಅಡ್ಡಿಪಡಿಸುವಂತಿದೆ:
- 397B ನಿಯತಾಂಕಗಳು, ಆದರೆ ಕೇವಲ 17B ಅನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಲಾಗಿದೆ
- ತೆರೆದ ತೂಕ, ಸ್ಥಳೀಯವಾಗಿ ನಿಯೋಜಿಸಬಹುದು
- ಏಜೆಂಟ್ ಸಾಮರ್ಥ್ಯ, ಕೇವಲ ಸಂಭಾಷಣೆಯಲ್ಲ
- ವೆಚ್ಚವು ಪ್ರತಿಸ್ಪರ್ಧಿಗಳ 5% ಮಾತ್ರ
X ನಲ್ಲಿ ಒಂದು ಕುತೂಹಲಕಾರಿ ಭವಿಷ್ಯವಿದೆ:
"Qwen 3.5 Q4 ಆವೃತ್ತಿಗೆ ಕೇವಲ 225G ಅಗತ್ಯವಿದೆ, ಇದು ಬಹಳ ಪ್ರಾಯೋಗಿಕ ಮೌಲ್ಯವನ್ನು ಹೊಂದಿದೆ" — @janxin
225GB ಗ್ರಾಫಿಕ್ಸ್ ಮೆಮೊರಿ, ಏಕ ಯಂತ್ರದಲ್ಲಿ ರನ್ ಮಾಡಬಹುದು. ಇದರರ್ಥ ಸಣ್ಣ ಮತ್ತು ಮಧ್ಯಮ ಗಾತ್ರದ ಡೆವಲಪರ್ಗಳು GPT-5 ಮಟ್ಟದ ಮಾದರಿಯನ್ನು ಸಂಪರ್ಕಿಸಲು ಸಾಧ್ಯವಾಗುವುದು ಇದೇ ಮೊದಲು.
Qwen 3.5 GPT-5.3 ಅನ್ನು ಸೋಲಿಸಬಹುದೇ ಎಂಬುದು ನಿಜವಾದ ಪ್ರಶ್ನೆಯಲ್ಲ, ಆದರೆ: ಉನ್ನತ ಮಾದರಿಗಳ ವೆಚ್ಚವು ಶೂನ್ಯಕ್ಕೆ ಹತ್ತಿರವಾದಾಗ, AI ಕಂಪನಿಗಳು ಹೇಗೆ ಹಣ ಸಂಪಾದಿಸುತ್ತವೆ?





