Qwen 3.5 રિલીઝ: 397B પરિમાણોનું ઓપન વેઇટ મોડેલ, ખર્ચમાં 60% ઘટાડો

2/16/2026
3 min read

અલીબાબાએ હમણાં જ Qwen 3.5-397B-A17B રિલીઝ કર્યું છે. આ Qwen 3.5 શ્રેણીનું પ્રથમ ઓપન વેઇટ મોડેલ છે.

મુખ્ય ડેટા

  • કુલ પરિમાણો: 397B
  • સક્રિય પરિમાણો: 17B per pass (સ્પાર્સ MoE)
  • થ્રુપુટ: Qwen 3-Max કરતાં 8.6x-19x વધારે
  • ખર્ચ: Qwen 3 કરતાં 60% ઓછો
  • ભાષા સપોર્ટ: 201 (119 થી વિસ્તૃત)

આ માત્ર પરિમાણોનો ઢગલો નથી. આ કાર્યક્ષમતાની પુનઃવ્યાખ્યા છે.

Qwen 3.5

આર્કિટેક્ચરલ ઇનોવેશન

Qwen 3.5 હાઇબ્રિડ આર્કિટેક્ચરનો ઉપયોગ કરે છે:

  • Gated Delta Networks + સ્પાર્સ MoE
  • હાઇબ્રિડ લીનિયર એટેન્શન: મોટાભાગના સ્તરો લીનિયર એટેન્શનનો ઉપયોગ કરે છે, દરેક 4 સ્તરો સંપૂર્ણ એટેન્શનનો ઉપયોગ કરે છે
  • મૂળ મલ્ટીમોડલ: પછીથી ઉમેરવામાં આવેલ નથી, પરંતુ શરૂઆતથી તાલીમ પામેલ છે

X પર તકનીકી વિશ્લેષણ છે:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

આ આર્કિટેક્ચરનો અર્થ એ છે કે: 17B સક્રિય પરિમાણો સાથે 400B મોડેલની નજીકની કામગીરી પ્રાપ્ત કરવી. અનુમાન ખર્ચમાં નોંધપાત્ર ઘટાડો થયો છે.

કામગીરીનો દાવો

અલીબાબાએ દાવો કર્યો છે કે Qwen 3.5 એ હરાવ્યું છે:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

X પર સ્વતંત્ર પરીક્ષકોએ ચકાસણી શરૂ કરી:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

પરંતુ સૌથી મહત્વપૂર્ણ બેન્ચમાર્ક નથી, પરંતુ એજન્ટ ક્ષમતા છે:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

એજન્ટ યુગ

Qwen 3.5 ની સ્થિતિ સ્પષ્ટ છે: એજન્ટ યુગ માટે ડિઝાઇન કરવામાં આવી છે.

  • 2 કલાકના વીડિયોનું વિશ્લેષણ કરી શકે છે
  • એપ્લિકેશન કાર્યોને સ્વતંત્ર રીતે પાર પાડી શકે છે
  • GUI ને સમજી શકે છે અને તેની સાથે ક્રિયાપ્રતિક્રિયા કરી શકે છે

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

આનો અર્થ એ છે કે તે "ચેટબોટ" નથી, પરંતુ "ટાસ્ક એક્ઝિક્યુટર" છે.

સ્પર્ધાત્મક લેન્ડસ્કેપ

X પર કોઈએ આ અઠવાડિયાની AI રિલીઝનો સારાંશ આપ્યો:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

ચાઇનીઝ મોડેલ ઉત્પાદકોની લય સ્પષ્ટ છે:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

દર અઠવાડિયે એક નવું મોડેલ આવે છે, અને દરેક વખતે GPT ને હરાવવાનો દાવો કરવામાં આવે છે. આ માર્કેટિંગ નથી, આ ખર્ચ યુદ્ધનું અપગ્રેડ છે.

ખર્ચ માળખું

Qwen 3.5 ની ટોકન કિંમત Gemini 3 Pro ની માત્ર 1/18 છે.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

જ્યારે કામગીરી નજીક હોય અને ખર્ચ માત્ર 5% હોય, તો બંધ સ્ત્રોત મોડેલનો ગઢ ક્યાં છે?

બોટમ લાઇન

Qwen 3.5 એ "ચાઇનાનું GPT" નથી. તે ખર્ચ માળખાનો વિક્ષેપકારક છે:

  1. 397B પરિમાણો, પરંતુ માત્ર 17B સક્રિય છે
  2. ઓપન વેઇટ, સ્થાનિક રીતે જમાવી શકાય છે
  3. એજન્ટ ક્ષમતા, માત્ર વાતચીત જ નહીં
  4. ખર્ચ હરીફોના માત્ર 5%

X પર એક રસપ્રદ આગાહી છે:

"Qwen 3.5 Q4 વર્ઝનને માત્ર 225G ની જરૂર છે, જે ખૂબ જ વ્યવહારુ છે" — @janxin

225GB વિડીયો મેમરી, એક જ મશીન પર ચાલી શકે છે. આનો અર્થ એ છે કે નાના અને મધ્યમ કદના વિકાસકર્તાઓ પ્રથમ વખત GPT-5 સ્તરની નજીકના મોડેલનો સંપર્ક કરી શકશે.

વાસ્તવિક પ્રશ્ન એ નથી કે Qwen 3.5 GPT-5.3 ને હરાવી શકે છે કે નહીં, પરંતુ: જ્યારે ટોચના મોડેલનો ખર્ચ લગભગ શૂન્ય થઈ જાય છે, ત્યારે AI કંપનીઓ કેવી રીતે પૈસા કમાય છે?

Published in Technology

You Might Also Like

કેમ ક્લાઉડ કમ્પ્યુટિંગ ટેકનોલોજીનો ઉપયોગ કરવો: તમારું પ્રથમ ક્લાઉડ ઇન્ફ્રાસ્ટ્રક્ચર બનાવવાની સંપૂર્ણ માર્ગદર્શિકાTechnology

કેમ ક્લાઉડ કમ્પ્યુટિંગ ટેકનોલોજીનો ઉપયોગ કરવો: તમારું પ્રથમ ક્લાઉડ ઇન્ફ્રાસ્ટ્રક્ચર બનાવવાની સંપૂર્ણ માર્ગદર્શિકા

કેમ ક્લાઉડ કમ્પ્યુટિંગ ટેકનોલોજીનો ઉપયોગ કરવો: તમારું પ્રથમ ક્લાઉડ ઇન્ફ્રાસ્ટ્રક્ચર બનાવવાની સંપૂર્ણ માર્ગદર્શિકા પરિચય ...

ચેતવણી! Claude Codeના પિતા કહે છે: 1 મહિના પછી Plan Modeનો ઉપયોગ નહીં થાય, સોફ્ટવેર એન્જિનિયરની ટાઇટલ ગાયબ થઈ જશેTechnology

ચેતવણી! Claude Codeના પિતા કહે છે: 1 મહિના પછી Plan Modeનો ઉપયોગ નહીં થાય, સોફ્ટવેર એન્જિનિયરની ટાઇટલ ગાયબ થઈ જશે

ચેતવણી! Claude Codeના પિતા કહે છે: 1 મહિના પછી Plan Modeનો ઉપયોગ નહીં થાય, સોફ્ટવેર એન્જિનિયરની ટાઇટલ ગાયબ થઈ જશે તાજેત...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026年 Top 10 AI 代理:核心卖点解析Technology

2026年 Top 10 AI 代理:核心卖点解析

2026年 Top 10 AI 代理:核心卖点解析 引言 人工智能ના ઝડપી વિકાસ સાથે, AI એજન્ટ (AI Agents) ટેકનોલોજી ક્ષેત્રમાં હોટ ટોપિક બની ગયા છે. વધુ...

2026માં ટોપ 10 AI સાધનોની ભલામણ: કૃત્રિમ બુદ્ધિમત્તાનો સાચો પોટેંશિયલ મુક્ત કરોTechnology

2026માં ટોપ 10 AI સાધનોની ભલામણ: કૃત્રિમ બુદ્ધિમત્તાનો સાચો પોટેંશિયલ મુક્ત કરો

2026માં ટોપ 10 AI સાધનોની ભલામણ: કૃત્રિમ બુદ્ધિમત્તાનો સાચો પોટેંશિયલ મુક્ત કરો આજના ટેકનોલોજી ઝડપથી વિકાસ પામતા સમયમાં,...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 在快速发展的云计算领域,Amazon Web Services (AWS) 一直是领军者,提供丰富的服务和工具,帮助开发者、企业和技术专家在云上有效工作。以下是2026年值得关注的十大AWS工...