Qwen 3.5 રિલીઝ: 397B પરિમાણોનું ઓપન વેઇટ મોડેલ, ખર્ચમાં 60% ઘટાડો
અલીબાબાએ હમણાં જ Qwen 3.5-397B-A17B રિલીઝ કર્યું છે. આ Qwen 3.5 શ્રેણીનું પ્રથમ ઓપન વેઇટ મોડેલ છે.
મુખ્ય ડેટા
- કુલ પરિમાણો: 397B
- સક્રિય પરિમાણો: 17B per pass (સ્પાર્સ MoE)
- થ્રુપુટ: Qwen 3-Max કરતાં 8.6x-19x વધારે
- ખર્ચ: Qwen 3 કરતાં 60% ઓછો
- ભાષા સપોર્ટ: 201 (119 થી વિસ્તૃત)
આ માત્ર પરિમાણોનો ઢગલો નથી. આ કાર્યક્ષમતાની પુનઃવ્યાખ્યા છે.

આર્કિટેક્ચરલ ઇનોવેશન
Qwen 3.5 હાઇબ્રિડ આર્કિટેક્ચરનો ઉપયોગ કરે છે:
- Gated Delta Networks + સ્પાર્સ MoE
- હાઇબ્રિડ લીનિયર એટેન્શન: મોટાભાગના સ્તરો લીનિયર એટેન્શનનો ઉપયોગ કરે છે, દરેક 4 સ્તરો સંપૂર્ણ એટેન્શનનો ઉપયોગ કરે છે
- મૂળ મલ્ટીમોડલ: પછીથી ઉમેરવામાં આવેલ નથી, પરંતુ શરૂઆતથી તાલીમ પામેલ છે
X પર તકનીકી વિશ્લેષણ છે:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
આ આર્કિટેક્ચરનો અર્થ એ છે કે: 17B સક્રિય પરિમાણો સાથે 400B મોડેલની નજીકની કામગીરી પ્રાપ્ત કરવી. અનુમાન ખર્ચમાં નોંધપાત્ર ઘટાડો થયો છે.
કામગીરીનો દાવો
અલીબાબાએ દાવો કર્યો છે કે Qwen 3.5 એ હરાવ્યું છે:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
X પર સ્વતંત્ર પરીક્ષકોએ ચકાસણી શરૂ કરી:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
પરંતુ સૌથી મહત્વપૂર્ણ બેન્ચમાર્ક નથી, પરંતુ એજન્ટ ક્ષમતા છે:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
એજન્ટ યુગ
Qwen 3.5 ની સ્થિતિ સ્પષ્ટ છે: એજન્ટ યુગ માટે ડિઝાઇન કરવામાં આવી છે.
- 2 કલાકના વીડિયોનું વિશ્લેષણ કરી શકે છે
- એપ્લિકેશન કાર્યોને સ્વતંત્ર રીતે પાર પાડી શકે છે
- GUI ને સમજી શકે છે અને તેની સાથે ક્રિયાપ્રતિક્રિયા કરી શકે છે
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
આનો અર્થ એ છે કે તે "ચેટબોટ" નથી, પરંતુ "ટાસ્ક એક્ઝિક્યુટર" છે.
સ્પર્ધાત્મક લેન્ડસ્કેપ
X પર કોઈએ આ અઠવાડિયાની AI રિલીઝનો સારાંશ આપ્યો:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
ચાઇનીઝ મોડેલ ઉત્પાદકોની લય સ્પષ્ટ છે:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
દર અઠવાડિયે એક નવું મોડેલ આવે છે, અને દરેક વખતે GPT ને હરાવવાનો દાવો કરવામાં આવે છે. આ માર્કેટિંગ નથી, આ ખર્ચ યુદ્ધનું અપગ્રેડ છે.
ખર્ચ માળખું
Qwen 3.5 ની ટોકન કિંમત Gemini 3 Pro ની માત્ર 1/18 છે.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
જ્યારે કામગીરી નજીક હોય અને ખર્ચ માત્ર 5% હોય, તો બંધ સ્ત્રોત મોડેલનો ગઢ ક્યાં છે?
બોટમ લાઇન
Qwen 3.5 એ "ચાઇનાનું GPT" નથી. તે ખર્ચ માળખાનો વિક્ષેપકારક છે:
- 397B પરિમાણો, પરંતુ માત્ર 17B સક્રિય છે
- ઓપન વેઇટ, સ્થાનિક રીતે જમાવી શકાય છે
- એજન્ટ ક્ષમતા, માત્ર વાતચીત જ નહીં
- ખર્ચ હરીફોના માત્ર 5%
X પર એક રસપ્રદ આગાહી છે:
"Qwen 3.5 Q4 વર્ઝનને માત્ર 225G ની જરૂર છે, જે ખૂબ જ વ્યવહારુ છે" — @janxin
225GB વિડીયો મેમરી, એક જ મશીન પર ચાલી શકે છે. આનો અર્થ એ છે કે નાના અને મધ્યમ કદના વિકાસકર્તાઓ પ્રથમ વખત GPT-5 સ્તરની નજીકના મોડેલનો સંપર્ક કરી શકશે.
વાસ્તવિક પ્રશ્ન એ નથી કે Qwen 3.5 GPT-5.3 ને હરાવી શકે છે કે નહીં, પરંતુ: જ્યારે ટોચના મોડેલનો ખર્ચ લગભગ શૂન્ય થઈ જાય છે, ત્યારે AI કંપનીઓ કેવી રીતે પૈસા કમાય છે?





