Qwen 3.5 విడుదల: 397B పారామీటర్ల ఓపెన్ వెయిట్ మోడల్, ఖర్చు 60% తగ్గింపు

2/16/2026
3 min read

అలీబాబా ఇప్పుడే Qwen 3.5-397B-A17Bని విడుదల చేసింది. ఇది Qwen 3.5 సిరీస్‌లో మొదటి ఓపెన్ వెయిట్ మోడల్.

ముఖ్యమైన డేటా

  • మొత్తం పారామీటర్లు: 397B
  • యాక్టివ్ పారామీటర్లు: 17B per pass (విರಳ MoE)
  • త్రుపుట్‌: Qwen 3-Max కంటే 8.6x-19x ఎక్కువ
  • ఖర్చు: Qwen 3 కంటే 60% తక్కువ
  • భాషా మద్దతు: 201 (119 నుండి విస్తరించబడింది)

ఇది సాధారణ పారామీటర్ల స్టాకింగ్ కాదు. ఇది సమర్థత యొక్క పునర్నిర్వచనం.

Qwen 3.5

ఆర్కిటెక్చర్ ఆవిష్కరణ

Qwen 3.5 మిశ్రమ ఆర్కిటెక్చర్‌ను ఉపయోగిస్తుంది:

  • Gated Delta Networks + విರಳ MoE
  • మిశ్రమ లీనియర్ అటెన్షన్: చాలా లేయర్‌లు లీనియర్ అటెన్షన్‌ను ఉపయోగిస్తాయి, ప్రతి 4 లేయర్‌లకు పూర్తి అటెన్షన్
  • స్థానిక మల్టీమోడల్: ఇది తరువాత జోడించబడలేదు, కానీ మొదటి నుండి శిక్షణ పొందింది

Xలో సాంకేతిక విశ్లేషణ ఉంది:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

ఈ ఆర్కిటెక్చర్ యొక్క ప్రాముఖ్యత ఏమిటంటే: 17B యాక్టివ్ పారామీటర్‌లతో దాదాపు 400B మోడల్ పనితీరును సాధించడం. అనుమితి వ్యయం గణనీయంగా తగ్గింది.

పనితీరు ప్రకటన

Qwen 3.5 వీటిని ఓడించిందని అలీబాబా పేర్కొంది:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Xలోని స్వతంత్ర పరీక్షకులు ధృవీకరించడం ప్రారంభించారు:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

కానీ ముఖ్యమైన విషయం బెంచ్‌మార్క్‌లు కాదు, ఏజెంట్ సామర్థ్యం:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

ఏజెంట్ యుగం

Qwen 3.5 యొక్క స్థానం స్పష్టంగా ఉంది: ఏజెంట్ యుగం కోసం రూపొందించబడింది.

  • 2 గంటల వీడియోను విశ్లేషించగలదు
  • క్రాస్-యాప్ టాస్క్‌లను స్వతంత్రంగా అమలు చేయగలదు
  • GUIని అర్థం చేసుకోగలదు మరియు దానితో సంభాషించగలదు

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

దీని అర్థం ఇది "చాట్‌బాట్" కాదు, "టాస్క్ ఎగ్జిక్యూటర్".

పోటీ దృశ్యం

Xలో ఒకరు ఈ వారం AI విడుదలను సంగ్రహించారు:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

చైనీస్ మోడల్ తయారీదారుల లయ స్పష్టంగా ఉంది:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

ప్రతి వారం కొత్త మోడల్ వస్తుంది, ప్రతిసారీ GPTని ఓడించినట్లు పేర్కొంటున్నారు. ఇది మార్కెటింగ్ కాదు, ఇది ఖర్చు యుద్ధం యొక్క పెరుగుదల.

వ్యయ నిర్మాణం

Qwen 3.5 యొక్క టోకెన్ ధర Gemini 3 Pro కంటే 1/18 మాత్రమే.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

పనితీరు దగ్గరగా ఉన్నప్పుడు మరియు ఖర్చు 5% మాత్రమే ఉన్నప్పుడు, క్లోజ్డ్ సోర్స్ మోడల్ యొక్క కోట ఎక్కడ ఉంది?

బాటమ్ లైన్

Qwen 3.5 "చైనా యొక్క GPT" కాదు. ఇది వ్యయ నిర్మాణం యొక్క విచ్ఛిన్నం:

  1. 397B పారామీటర్లు, కానీ 17B మాత్రమే యాక్టివేట్ చేయబడ్డాయి
  2. ఓపెన్ వెయిట్, స్థానికంగా అమలు చేయవచ్చు
  3. ఏజెంట్ సామర్థ్యం, సంభాషణ మాత్రమే కాదు
  4. ఖర్చు పోటీదారుల కంటే 5% మాత్రమే

Xలో ఒక ఆసక్తికరమైన అంచనా ఉంది:

"Qwen 3.5 Q4 వెర్షన్ 225G మాత్రమే అవసరం, ఇది చాలా ఆచరణాత్మకమైనది" — @janxin

225GB వీడియో మెమరీ, ఒకే మెషీన్‌లో రన్ చేయవచ్చు. దీని అర్థం చిన్న మరియు మధ్య తరహా డెవలపర్‌లు మొదటిసారిగా GPT-5 స్థాయికి దగ్గరగా ఉన్న మోడల్‌ను యాక్సెస్ చేయగలరు.

Qwen 3.5 GPT-5.3ని ఓడిస్తుందా అనేది నిజమైన ప్రశ్న కాదు, కానీ: టాప్ మోడల్స్ ఖర్చు దాదాపు సున్నాకు పడిపోయినప్పుడు, AI కంపెనీలు ఎలా డబ్బు సంపాదిస్తాయి?

Published in Technology

You Might Also Like

మీ మొదటి క్లౌడ్ మౌలిక నిర్మాణాన్ని నిర్మించడం: పూర్తి మార్గదర్శకత్వంTechnology

మీ మొదటి క్లౌడ్ మౌలిక నిర్మాణాన్ని నిర్మించడం: పూర్తి మార్గదర్శకత్వం

మీ మొదటి క్లౌడ్ మౌలిక నిర్మాణాన్ని నిర్మించడం: పూర్తి మార్గదర్శకత్వం పరిచయం డిజిటల్ మార్పిడి వేగవంతం కావడంతో, క్లౌడ్ కంప...

అవగాహన! Claude Code యొక్క తండ్రి స్పష్టంగా చెప్పాడు: 1 నెల తర్వాత Plan Mode ఉపయోగించకపోతే, సాఫ్ట్‌వేర్ ఇంజనీర్ శీర్షిక నశించిపోతుందిTechnology

అవగాహన! Claude Code యొక్క తండ్రి స్పష్టంగా చెప్పాడు: 1 నెల తర్వాత Plan Mode ఉపయోగించకపోతే, సాఫ్ట్‌వేర్ ఇంజనీర్ శీర్షిక నశించిపోతుంది

అవగాహన! Claude Code యొక్క తండ్రి స్పష్టంగా చెప్పాడు: 1 నెల తర్వాత Plan Mode ఉపయోగించకపోతే, సాఫ్ట్‌వేర్ ఇంజనీర్ శీర్షిక న...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026 సంవత్సరంలో టాప్ 10 AI ఏజెంట్లు: కేంద్రీయ విక్రయ పాయింట్ల విశ్లేషణTechnology

2026 సంవత్సరంలో టాప్ 10 AI ఏజెంట్లు: కేంద్రీయ విక్రయ పాయింట్ల విశ్లేషణ

2026 సంవత్సరంలో టాప్ 10 AI ఏజెంట్లు: కేంద్రీయ విక్రయ పాయింట్ల విశ్లేషణ పరిచయం కృత్రిమ మేధస్సు యొక్క వేగవంతమైన అభివృద్ధిత...

2026లో టాప్ 10 AI సాధనాలు: కృత్రిమ మేధస్సు యొక్క నిజమైన సామర్థ్యాన్ని విడుదల చేయండిTechnology

2026లో టాప్ 10 AI సాధనాలు: కృత్రిమ మేధస్సు యొక్క నిజమైన సామర్థ్యాన్ని విడుదల చేయండి

2026లో టాప్ 10 AI సాధనాలు: కృత్రిమ మేధస్సు యొక్క నిజమైన సామర్థ్యాన్ని విడుదల చేయండి ప్రযুক্তి వేగంగా అభివృద్ధి చెందుతున్...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 在快速发展的云计算领域,Amazon Web Services (AWS) 一直是领军者,提供丰富的服务和工具,帮助开发者、企业和技术专家在云上有效工作。以下是2026年值得关注的十大AWS工...