Qwen 3.5 ਜਾਰੀ: 397B ਪੈਰਾਮੀਟਰਾਂ ਵਾਲਾ ਓਪਨ ਵੇਟ ਮਾਡਲ, ਲਾਗਤ 60% ਘੱਟ
ਅਲੀਬਾਬਾ ਨੇ ਹੁਣੇ ਹੀ Qwen 3.5-397B-A17B ਜਾਰੀ ਕੀਤਾ ਹੈ। ਇਹ Qwen 3.5 ਸੀਰੀਜ਼ ਦਾ ਪਹਿਲਾ ਓਪਨ ਵੇਟ ਮਾਡਲ ਹੈ।
ਮੁੱਖ ਡਾਟਾ
- ਕੁੱਲ ਪੈਰਾਮੀਟਰ: 397B
- ਐਕਟੀਵੇਸ਼ਨ ਪੈਰਾਮੀਟਰ: 17B per pass (ਵਿਰਲੀ MoE)
- ਥਰੂਪੁੱਟ: Qwen 3-Max ਨਾਲੋਂ 8.6x-19x ਵੱਧ
- ਲਾਗਤ: Qwen 3 ਨਾਲੋਂ 60% ਘੱਟ
- ਭਾਸ਼ਾ ਸਹਾਇਤਾ: 201 ਕਿਸਮਾਂ (119 ਕਿਸਮਾਂ ਤੋਂ ਵਧਾਈ ਗਈ)
ਇਹ ਸਿਰਫ਼ ਪੈਰਾਮੀਟਰਾਂ ਦਾ ਢੇਰ ਨਹੀਂ ਹੈ। ਇਹ ਕੁਸ਼ਲਤਾ ਦੀ ਮੁੜ ਪਰਿਭਾਸ਼ਾ ਹੈ।

ਆਰਕੀਟੈਕਚਰ ਨਵੀਨਤਾ
Qwen 3.5 ਇੱਕ ਹਾਈਬ੍ਰਿਡ ਆਰਕੀਟੈਕਚਰ ਵਰਤਦਾ ਹੈ:
- Gated Delta Networks + ਵਿਰਲੀ MoE
- ਹਾਈਬ੍ਰਿਡ ਲੀਨੀਅਰ ਅਟੈਨਸ਼ਨ: ਜ਼ਿਆਦਾਤਰ ਲੇਅਰ ਲੀਨੀਅਰ ਅਟੈਨਸ਼ਨ ਵਰਤਦੀਆਂ ਹਨ, ਹਰ 4 ਲੇਅਰ ਪੂਰੀ ਅਟੈਨਸ਼ਨ ਵਰਤਦੀਆਂ ਹਨ
- ਮੂਲ ਮਲਟੀਮੋਡਲ: ਬਾਅਦ ਵਿੱਚ ਜੋੜਿਆ ਨਹੀਂ ਗਿਆ, ਸਗੋਂ ਸ਼ੁਰੂ ਤੋਂ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ
X 'ਤੇ ਤਕਨੀਕੀ ਵਿਸ਼ਲੇਸ਼ਣ ਹੈ:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
ਇਸ ਆਰਕੀਟੈਕਚਰ ਦਾ ਮਹੱਤਵ ਇਹ ਹੈ: 17B ਐਕਟੀਵੇਸ਼ਨ ਪੈਰਾਮੀਟਰਾਂ ਨਾਲ 400B ਮਾਡਲ ਦੇ ਨੇੜੇ ਪ੍ਰਦਰਸ਼ਨ ਪ੍ਰਾਪਤ ਕਰਨਾ। ਅਨੁਮਾਨ ਲਾਗਤ ਵਿੱਚ ਭਾਰੀ ਗਿਰਾਵਟ ਆਈ ਹੈ।
ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਦਾਅਵਾ
ਅਲੀਬਾਬਾ ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ Qwen 3.5 ਨੇ ਹਰਾਇਆ ਹੈ:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
X 'ਤੇ ਸੁਤੰਤਰ ਟੈਸਟਰਾਂ ਨੇ ਤਸਦੀਕ ਕਰਨੀ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤੀ ਹੈ:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
ਪਰ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਬੈਂਚਮਾਰਕ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਏਜੰਟ ਸਮਰੱਥਾ ਹੈ:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
ਏਜੰਟ ਯੁੱਗ
Qwen 3.5 ਦੀ ਸਥਿਤੀ ਬਹੁਤ ਸਪੱਸ਼ਟ ਹੈ: ਏਜੰਟ ਯੁੱਗ ਲਈ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ।
- 2 ਘੰਟੇ ਦੀ ਵੀਡੀਓ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰ ਸਕਦਾ ਹੈ
- ਸੁਤੰਤਰ ਤੌਰ 'ਤੇ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ
- GUI ਨੂੰ ਸਮਝ ਸਕਦਾ ਹੈ ਅਤੇ ਇਸ ਨਾਲ ਗੱਲਬਾਤ ਕਰ ਸਕਦਾ ਹੈ
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਇਹ "ਚੈਟਬੋਟ" ਨਹੀਂ ਹੈ, ਸਗੋਂ "ਟਾਸਕ ਐਗਜ਼ੀਕਿਊਟਰ" ਹੈ।
ਮੁਕਾਬਲੇ ਵਾਲਾ ਲੈਂਡਸਕੇਪ
X 'ਤੇ ਕਿਸੇ ਨੇ ਇਸ ਹਫ਼ਤੇ ਦੀ AI ਰਿਲੀਜ਼ ਦਾ ਸਾਰ ਦਿੱਤਾ:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
ਚੀਨੀ ਮਾਡਲ ਨਿਰਮਾਤਾਵਾਂ ਦੀ ਲੈਅ ਬਹੁਤ ਸਪੱਸ਼ਟ ਹੈ:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
ਹਰ ਹਫ਼ਤੇ ਇੱਕ ਨਵਾਂ ਮਾਡਲ ਆਉਂਦਾ ਹੈ, ਹਰ ਵਾਰ GPT ਨੂੰ ਹਰਾਉਣ ਦਾ ਦਾਅਵਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਇਹ ਮਾਰਕੀਟਿੰਗ ਨਹੀਂ ਹੈ, ਇਹ ਲਾਗਤ ਯੁੱਧ ਦਾ ਵਾਧਾ ਹੈ।
ਲਾਗਤ ਢਾਂਚਾ
Qwen 3.5 ਦੀ ਟੋਕਨ ਕੀਮਤ Gemini 3 Pro ਨਾਲੋਂ ਸਿਰਫ਼ 1/18 ਹੈ।
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
ਜਦੋਂ ਪ੍ਰਦਰਸ਼ਨ ਨੇੜੇ ਹੈ, ਅਤੇ ਲਾਗਤ ਸਿਰਫ਼ 5% ਹੈ, ਤਾਂ ਬੰਦ ਸਰੋਤ ਮਾਡਲ ਦੀ ਖਾਈ ਕਿੱਥੇ ਹੈ?
ਹੇਠਲੀ ਲਾਈਨ
Qwen 3.5 "ਚੀਨ ਦਾ GPT" ਨਹੀਂ ਹੈ। ਇਹ ਲਾਗਤ ਢਾਂਚੇ ਦਾ ਵਿਘਨਕਾਰੀ ਹੈ:
- 397B ਪੈਰਾਮੀਟਰ, ਪਰ ਸਿਰਫ਼ 17B ਨੂੰ ਐਕਟੀਵੇਟ ਕਰੋ
- ਓਪਨ ਵੇਟ, ਸਥਾਨਕ ਤੌਰ 'ਤੇ ਤਾਇਨਾਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ
- ਏਜੰਟ ਸਮਰੱਥਾ, ਸਿਰਫ਼ ਗੱਲਬਾਤ ਨਹੀਂ
- ਲਾਗਤ ਮੁਕਾਬਲੇਬਾਜ਼ਾਂ ਨਾਲੋਂ ਸਿਰਫ਼ 5%
X 'ਤੇ ਇੱਕ ਦਿਲਚਸਪ ਭਵਿੱਖਬਾਣੀ ਹੈ:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
225GB ਵੀਡੀਓ ਮੈਮੋਰੀ, ਸਿੰਗਲ ਮਸ਼ੀਨ 'ਤੇ ਚੱਲ ਸਕਦੀ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਛੋਟੇ ਅਤੇ ਦਰਮਿਆਨੇ ਆਕਾਰ ਦੇ ਡਿਵੈਲਪਰ ਪਹਿਲੀ ਵਾਰ GPT-5 ਪੱਧਰ ਦੇ ਮਾਡਲ ਦੇ ਨੇੜੇ ਪਹੁੰਚ ਸਕਦੇ ਹਨ।
ਅਸਲ ਸਵਾਲ ਇਹ ਨਹੀਂ ਹੈ ਕਿ ਕੀ Qwen 3.5 GPT-5.3 ਨੂੰ ਹਰਾ ਸਕਦਾ ਹੈ, ਸਗੋਂ ਇਹ ਹੈ: ਜਦੋਂ ਚੋਟੀ ਦੇ ਮਾਡਲਾਂ ਦੀ ਲਾਗਤ ਲਗਭਗ ਜ਼ੀਰੋ ਹੋ ਜਾਂਦੀ ਹੈ, ਤਾਂ AI ਕੰਪਨੀਆਂ ਪੈਸਾ ਕਿਵੇਂ ਕਮਾਉਂਦੀਆਂ ਹਨ?





