Qwen 3.5-ის გამოშვება: 397B პარამეტრის მქონე ღია წონის მოდელი, 60%-ით შემცირებული ღირებულებით
ალიბაბამ ახლახან გამოუშვა Qwen 3.5-397B-A17B. ეს არის Qwen 3.5 სერიის პირველი ღია წონის მოდელი.
ძირითადი მონაცემები
- ჯამური პარამეტრები: 397B
- გააქტიურებული პარამეტრები: 17B per pass (იშვიათი MoE)
- გამტარუნარიანობა: Qwen 3-Max-ზე 8.6x-19x-ით მეტი
- ღირებულება: Qwen 3-ზე 60%-ით ნაკლები
- ენების მხარდაჭერა: 201 (გაფართოვდა 119-დან)
ეს არ არის უბრალოდ პარამეტრების დაგროვება. ეს არის ეფექტურობის ხელახალი განსაზღვრა.

არქიტექტურული ინოვაცია
Qwen 3.5 იყენებს ჰიბრიდულ არქიტექტურას:
- Gated Delta Networks + იშვიათი MoE
- ჰიბრიდული წრფივი ყურადღება: ფენების უმეტესობა იყენებს წრფივ ყურადღებას, ყოველ 4 ფენაში გამოიყენება სრული ყურადღება
- მშობლიური მრავალმოდალურობა: არ არის დამატებული მოგვიანებით, არამედ თავიდანვე გაწვრთნილი
X-ზე არის ტექნიკური ანალიზი:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
ამ არქიტექტურის მნიშვნელობა იმაშია, რომ: 17B გააქტიურებული პარამეტრით მიაღწიოს 400B მოდელის შესრულებას. დასკვნის ღირებულება მნიშვნელოვნად მცირდება.
შესრულების განაცხადი
ალიბაბა აცხადებს, რომ Qwen 3.5-მა დაამარცხა:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
X-ზე დამოუკიდებელი ტესტერები იწყებენ გადამოწმებას:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
მაგრამ ყველაზე მნიშვნელოვანი არ არის საორიენტაციო ნიშნები, არამედ აგენტის შესაძლებლობები:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
აგენტის ერა
Qwen 3.5-ის პოზიციონირება ძალიან მკაფიოა: შექმნილია აგენტის ერისთვის.
- შეუძლია 2 საათიანი ვიდეოს ანალიზი
- შეუძლია დამოუკიდებლად შეასრულოს აპლიკაციებს შორის ამოცანები
- შეუძლია GUI-ს გაგება და მასთან ურთიერთობა
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
ეს ნიშნავს, რომ ის არ არის „ჩეთბოტი“, არამედ „ამოცანების შემსრულებელი“.
კონკურენტული ლანდშაფტი
X-ზე ვიღაცამ შეაჯამა ამ კვირის AI გამოშვებები:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
ჩინური მოდელების მწარმოებლების რიტმი ძალიან მკაფიოა:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
ყოველ კვირას არის ახალი მოდელი და ყოველ ჯერზე აცხადებენ, რომ ამარცხებენ GPT-ს. ეს არ არის მარკეტინგი, ეს არის ღირებულების ომის ესკალაცია.
ღირებულების სტრუქტურა
Qwen 3.5-ის token-ის ფასი მხოლოდ Gemini 3 Pro-ს 1/18-ია.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
როდესაც შესრულება ახლოსაა და ღირებულება მხოლოდ 5%-ია, სად არის დახურული კოდის მოდელების დამცავი თხრილი?
დასკვნა
Qwen 3.5 არ არის „ჩინური GPT“. ის არის ღირებულების სტრუქტურის დამანგრეველი:
- 397B პარამეტრი, მაგრამ მხოლოდ 17B აქტიურდება
- ღია წონა, შესაძლებელია ლოკალურად განთავსება
- აგენტის შესაძლებლობები, არა მხოლოდ დიალოგი
- ღირებულება კონკურენტების მხოლოდ 5%-ია
X-ზე არის საინტერესო პროგნოზი:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
225GB ვიდეო მეხსიერება, შესაძლებელია ერთ მანქანაზე გაშვება. ეს ნიშნავს, რომ მცირე და საშუალო დეველოპერებს პირველად შეუძლიათ GPT-5 დონის მოდელთან შეხება.
ნამდვილი პრობლემა არ არის ის, შეუძლია თუ არა Qwen 3.5-ს GPT-5.3-ის დამარცხება, არამედ: როგორ შოულობენ ფულს AI კომპანიები, როდესაც უმაღლესი დონის მოდელების ღირებულება თითქმის ნულამდე ეცემა?





