Qwen 3.5-ის გამოშვება: 397B პარამეტრის მქონე ღია წონის მოდელი, 60%-ით შემცირებული ღირებულებით

2/16/2026
3 min read

ალიბაბამ ახლახან გამოუშვა Qwen 3.5-397B-A17B. ეს არის Qwen 3.5 სერიის პირველი ღია წონის მოდელი.

ძირითადი მონაცემები

  • ჯამური პარამეტრები: 397B
  • გააქტიურებული პარამეტრები: 17B per pass (იშვიათი MoE)
  • გამტარუნარიანობა: Qwen 3-Max-ზე 8.6x-19x-ით მეტი
  • ღირებულება: Qwen 3-ზე 60%-ით ნაკლები
  • ენების მხარდაჭერა: 201 (გაფართოვდა 119-დან)

ეს არ არის უბრალოდ პარამეტრების დაგროვება. ეს არის ეფექტურობის ხელახალი განსაზღვრა.

Qwen 3.5

არქიტექტურული ინოვაცია

Qwen 3.5 იყენებს ჰიბრიდულ არქიტექტურას:

  • Gated Delta Networks + იშვიათი MoE
  • ჰიბრიდული წრფივი ყურადღება: ფენების უმეტესობა იყენებს წრფივ ყურადღებას, ყოველ 4 ფენაში გამოიყენება სრული ყურადღება
  • მშობლიური მრავალმოდალურობა: არ არის დამატებული მოგვიანებით, არამედ თავიდანვე გაწვრთნილი

X-ზე არის ტექნიკური ანალიზი:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

ამ არქიტექტურის მნიშვნელობა იმაშია, რომ: 17B გააქტიურებული პარამეტრით მიაღწიოს 400B მოდელის შესრულებას. დასკვნის ღირებულება მნიშვნელოვნად მცირდება.

შესრულების განაცხადი

ალიბაბა აცხადებს, რომ Qwen 3.5-მა დაამარცხა:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

X-ზე დამოუკიდებელი ტესტერები იწყებენ გადამოწმებას:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

მაგრამ ყველაზე მნიშვნელოვანი არ არის საორიენტაციო ნიშნები, არამედ აგენტის შესაძლებლობები:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

აგენტის ერა

Qwen 3.5-ის პოზიციონირება ძალიან მკაფიოა: შექმნილია აგენტის ერისთვის.

  • შეუძლია 2 საათიანი ვიდეოს ანალიზი
  • შეუძლია დამოუკიდებლად შეასრულოს აპლიკაციებს შორის ამოცანები
  • შეუძლია GUI-ს გაგება და მასთან ურთიერთობა

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

ეს ნიშნავს, რომ ის არ არის „ჩეთბოტი“, არამედ „ამოცანების შემსრულებელი“.

კონკურენტული ლანდშაფტი

X-ზე ვიღაცამ შეაჯამა ამ კვირის AI გამოშვებები:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

ჩინური მოდელების მწარმოებლების რიტმი ძალიან მკაფიოა:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

ყოველ კვირას არის ახალი მოდელი და ყოველ ჯერზე აცხადებენ, რომ ამარცხებენ GPT-ს. ეს არ არის მარკეტინგი, ეს არის ღირებულების ომის ესკალაცია.

ღირებულების სტრუქტურა

Qwen 3.5-ის token-ის ფასი მხოლოდ Gemini 3 Pro-ს 1/18-ია.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

როდესაც შესრულება ახლოსაა და ღირებულება მხოლოდ 5%-ია, სად არის დახურული კოდის მოდელების დამცავი თხრილი?

დასკვნა

Qwen 3.5 არ არის „ჩინური GPT“. ის არის ღირებულების სტრუქტურის დამანგრეველი:

  1. 397B პარამეტრი, მაგრამ მხოლოდ 17B აქტიურდება
  2. ღია წონა, შესაძლებელია ლოკალურად განთავსება
  3. აგენტის შესაძლებლობები, არა მხოლოდ დიალოგი
  4. ღირებულება კონკურენტების მხოლოდ 5%-ია

X-ზე არის საინტერესო პროგნოზი:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225GB ვიდეო მეხსიერება, შესაძლებელია ერთ მანქანაზე გაშვება. ეს ნიშნავს, რომ მცირე და საშუალო დეველოპერებს პირველად შეუძლიათ GPT-5 დონის მოდელთან შეხება.

ნამდვილი პრობლემა არ არის ის, შეუძლია თუ არა Qwen 3.5-ს GPT-5.3-ის დამარცხება, არამედ: როგორ შოულობენ ფულს AI კომპანიები, როდესაც უმაღლესი დონის მოდელების ღირებულება თითქმის ნულამდე ეცემა?

Published in Technology

You Might Also Like

როგორ გამოვიყენოთ ღრუბლოვანი კომპიუტერული ტექნოლოგიები: შექმენით თქვენი პირველი ღრუბლოვანი ინფრასტრუქტურის სრული სახელმძღვანელოTechnology

როგორ გამოვიყენოთ ღრუბლოვანი კომპიუტერული ტექნოლოგიები: შექმენით თქვენი პირველი ღრუბლოვანი ინფრასტრუქტურის სრული სახელმძღვანელო

[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLD...

გაფრთხილება! Claude Code-ის მამა პირდაპირ ამბობს: 1 თვის შემდეგ Plan Mode-ის გამოყენება აღარ იქნება საჭირო, პროგრამული ინჟინრების ტიტული გაქრებაTechnology

გაფრთხილება! Claude Code-ის მამა პირდაპირ ამბობს: 1 თვის შემდეგ Plan Mode-ის გამოყენება აღარ იქნება საჭირო, პროგრამული ინჟინრების ტიტული გაქრება

გაფრთხილება! Claude Code-ის მამა პირდაპირ ამბობს: 1 თვის შემდეგ Plan Mode-ის გამოყენება აღარ იქნება საჭირო, პროგრამული ი...

2026 წლის 10 საუკეთესო ღრმა სწავლების რესურსებიTechnology

2026 წლის 10 საუკეთესო ღრმა სწავლების რესურსები

2026 წლის 10 საუკეთესო ღრმა სწავლების რესურსები ღრმა სწავლების სწრაფი განვითარებით სხვადასხვა სფეროში, სულ უფრო მეტი სას...

2026 წლის 10 საუკეთესო AI აგენტი: ძირითადი მახასიათებლების ანალიზიTechnology

2026 წლის 10 საუკეთესო AI აგენტი: ძირითადი მახასიათებლების ანალიზი

2026 წლის 10 საუკეთესო AI აგენტი: ძირითადი მახასიათებლების ანალიზი შესავალი ხელოვნური ინტელიგენციის სწრაფი განვითარების ...

2026 წლის 10 საუკეთესო AI ინსტრუმენტი: ხელოვნური ინტელექტის რეალური პოტენციალის გათავისუფლებაTechnology

2026 წლის 10 საუკეთესო AI ინსტრუმენტი: ხელოვნური ინტელექტის რეალური პოტენციალის გათავისუფლება

2026 წლის 10 საუკეთესო AI ინსტრუმენტი: ხელოვნური ინტელექტის რეალური პოტენციალის გათავისუფლება დღეს ტექნოლოგიის სწრაფი გა...

2026 წლის საუკეთესო 10 AWS ინსტრუმენტი და რესურსიTechnology

2026 წლის საუკეთესო 10 AWS ინსტრუმენტი და რესურსი

2026 წლის საუკეთესო 10 AWS ინსტრუმენტი და რესურსი ბრიტანული სწრაფად განვითარებადი ღრუბლოვანი კომპიუტინგის სფეროში, Amazo...