Qwen 3.5-ის გამოშვება: 397B პარამეტრის მქონე ღია წონის მოდელი, 60%-ით შემცირებული ღირებულებით

ალიბაბამ ახლახან გამოუშვა Qwen 3.5-397B-A17B. ეს არის Qwen 3.5 სერიის პირველი ღია წონის მოდელი.

ძირითადი მონაცემები

ჯამური პარამეტრები: 397B
გააქტიურებული პარამეტრები: 17B per pass (იშვიათი MoE)
გამტარუნარიანობა: Qwen 3-Max-ზე 8.6x-19x-ით მეტი
ღირებულება: Qwen 3-ზე 60%-ით ნაკლები
ენების მხარდაჭერა: 201 (გაფართოვდა 119-დან)

ეს არ არის უბრალოდ პარამეტრების დაგროვება. ეს არის ეფექტურობის ხელახალი განსაზღვრა.

Qwen 3.5

არქიტექტურული ინოვაცია

Qwen 3.5 იყენებს ჰიბრიდულ არქიტექტურას:

Gated Delta Networks + იშვიათი MoE
ჰიბრიდული წრფივი ყურადღება: ფენების უმეტესობა იყენებს წრფივ ყურადღებას, ყოველ 4 ფენაში გამოიყენება სრული ყურადღება
მშობლიური მრავალმოდალურობა: არ არის დამატებული მოგვიანებით, არამედ თავიდანვე გაწვრთნილი

X-ზე არის ტექნიკური ანალიზი:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

ამ არქიტექტურის მნიშვნელობა იმაშია, რომ: 17B გააქტიურებული პარამეტრით მიაღწიოს 400B მოდელის შესრულებას. დასკვნის ღირებულება მნიშვნელოვნად მცირდება.

შესრულების განაცხადი

ალიბაბა აცხადებს, რომ Qwen 3.5-მა დაამარცხა:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

X-ზე დამოუკიდებელი ტესტერები იწყებენ გადამოწმებას:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

მაგრამ ყველაზე მნიშვნელოვანი არ არის საორიენტაციო ნიშნები, არამედ აგენტის შესაძლებლობები:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

აგენტის ერა

Qwen 3.5-ის პოზიციონირება ძალიან მკაფიოა: შექმნილია აგენტის ერისთვის.

შეუძლია 2 საათიანი ვიდეოს ანალიზი
შეუძლია დამოუკიდებლად შეასრულოს აპლიკაციებს შორის ამოცანები
შეუძლია GUI-ს გაგება და მასთან ურთიერთობა

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

ეს ნიშნავს, რომ ის არ არის „ჩეთბოტი“, არამედ „ამოცანების შემსრულებელი“.

კონკურენტული ლანდშაფტი

X-ზე ვიღაცამ შეაჯამა ამ კვირის AI გამოშვებები:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

ჩინური მოდელების მწარმოებლების რიტმი ძალიან მკაფიოა:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

ყოველ კვირას არის ახალი მოდელი და ყოველ ჯერზე აცხადებენ, რომ ამარცხებენ GPT-ს. ეს არ არის მარკეტინგი, ეს არის ღირებულების ომის ესკალაცია.

ღირებულების სტრუქტურა

Qwen 3.5-ის token-ის ფასი მხოლოდ Gemini 3 Pro-ს 1/18-ია.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

როდესაც შესრულება ახლოსაა და ღირებულება მხოლოდ 5%-ია, სად არის დახურული კოდის მოდელების დამცავი თხრილი?

დასკვნა

Qwen 3.5 არ არის „ჩინური GPT“. ის არის ღირებულების სტრუქტურის დამანგრეველი:

397B პარამეტრი, მაგრამ მხოლოდ 17B აქტიურდება
ღია წონა, შესაძლებელია ლოკალურად განთავსება
აგენტის შესაძლებლობები, არა მხოლოდ დიალოგი
ღირებულება კონკურენტების მხოლოდ 5%-ია

X-ზე არის საინტერესო პროგნოზი:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

225GB ვიდეო მეხსიერება, შესაძლებელია ერთ მანქანაზე გაშვება. ეს ნიშნავს, რომ მცირე და საშუალო დეველოპერებს პირველად შეუძლიათ GPT-5 დონის მოდელთან შეხება.

ნამდვილი პრობლემა არ არის ის, შეუძლია თუ არა Qwen 3.5-ს GPT-5.3-ის დამარცხება, არამედ: როგორ შოულობენ ფულს AI კომპანიები, როდესაც უმაღლესი დონის მოდელების ღირებულება თითქმის ნულამდე ეცემა?

Qwen 3.5-ის გამოშვება: 397B პარამეტრის მქონე ღია წონის მოდელი, 60%-ით შემცირებული ღირებულებით

ძირითადი მონაცემები

არქიტექტურული ინოვაცია

შესრულების განაცხადი

აგენტის ერა

კონკურენტული ლანდშაფტი

ღირებულების სტრუქტურა

დასკვნა

You Might Also Like

Claude Code Buddy შეცვლის სახელმძღვანელო: როგორ უნდა მიიღოთ ბრწყინვალე ლეგენდარული შინაური ცხოველი

Obsidian გამოუშვა Defuddle, Obsidian Web Clipper ახალ დონეზე გადაიყვანა

2026, აღარ უნდა აიძულო თავი "თვითკონტროლი"! გააკეთე ეს 8 პატარა საქმე, ჯანმრთელობა ბუნებრივად მოვა

იმ დედების შესახებ, რომლებიც ცდილობენ დაიკლონ წონა, მაგრამ ვერ ახერხებენ

AI Browser 24 საათიანი სტაბილური მუშაობის სახელმძღვანელო