Κυκλοφόρησε το Qwen 3.5: Ένα μοντέλο ανοιχτού βάρους με 397B παραμέτρους, με 60% μειωμένο κόστος

2/16/2026
3 min read

Η Alibaba μόλις κυκλοφόρησε το Qwen 3.5-397B-A17B. Αυτό είναι το πρώτο μοντέλο ανοιχτού βάρους της σειράς Qwen 3.5.

Βασικά Δεδομένα

  • Συνολικές Παράμετροι: 397B
  • Ενεργές Παράμετροι: 17B ανά πέρασμα (αραιό MoE)
  • Ροή Δεδομένων: 8.6x-19x βελτίωση σε σχέση με το Qwen 3-Max
  • Κόστος: 60% μείωση σε σχέση με το Qwen 3
  • Υποστήριξη Γλωσσών: 201 γλώσσες (επέκταση από 119)

Δεν είναι απλή στοίβαξη παραμέτρων. Είναι επαναπροσδιορισμός της αποδοτικότητας.

Qwen 3.5

Αρχιτεκτονική Καινοτομία

Το Qwen 3.5 χρησιμοποιεί υβριδική αρχιτεκτονική:

  • Gated Delta Networks + αραιό MoE
  • Υβριδική Γραμμική Προσοχή: Οι περισσότερες στρώσεις χρησιμοποιούν γραμμική προσοχή, κάθε 4 στρώσεις χρησιμοποιούν πλήρη προσοχή
  • Εγγενής Πολυτροπικότητα: Δεν προστέθηκε αργότερα, αλλά εκπαιδεύτηκε από την αρχή

Υπάρχει τεχνική ανάλυση στο X:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Η σημασία αυτής της αρχιτεκτονικής είναι: να επιτευχθεί απόδοση μοντέλου κοντά στα 400B με 17B ενεργές παραμέτρους. Το κόστος συμπερασμού μειώνεται σημαντικά.

Ισχυρισμοί Απόδοσης

Η Alibaba ισχυρίζεται ότι το Qwen 3.5 νίκησε:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Ανεξάρτητοι δοκιμαστές στο X άρχισαν να το επαληθεύουν:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Αλλά το πιο κρίσιμο δεν είναι τα benchmarks, αλλά η ικανότητα αντιπροσώπευσης:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Εποχή των Αντιπροσώπων

Η θέση του Qwen 3.5 είναι ξεκάθαρη: σχεδιασμένο για την εποχή των αντιπροσώπων.

  • Μπορεί να αναλύσει 2 ώρες βίντεο
  • Μπορεί να εκτελέσει ανεξάρτητα εργασίες σε εφαρμογές
  • Μπορεί να κατανοήσει το GUI και να αλληλεπιδράσει μαζί του

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Αυτό σημαίνει ότι δεν είναι ένα «chatbot», αλλά ένας «εκτελεστής εργασιών».

Ανταγωνιστικό Τοπίο

Κάποιος στο X συνόψισε τις κυκλοφορίες AI αυτής της εβδομάδας:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Ο ρυθμός των κινεζικών κατασκευαστών μοντέλων είναι σαφής:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Κάθε εβδομάδα υπάρχει ένα νέο μοντέλο, και κάθε φορά ισχυρίζονται ότι νικούν το GPT. Δεν είναι μάρκετινγκ, είναι αναβάθμιση του πολέμου κόστους.

Δομή Κόστους

Η τιμή token του Qwen 3.5 είναι μόνο το 1/18 του Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Όταν η απόδοση είναι κοντά και το κόστος είναι μόνο 5%, πού είναι το χαντάκι των κλειστών μοντέλων;

Σύνοψη

Το Qwen 3.5 δεν είναι το «κινεζικό GPT». Είναι ανατροπέας της δομής κόστους:

  1. 397B παράμετροι, αλλά ενεργοποιούνται μόνο 17B
  2. Ανοιχτό βάρος, μπορεί να αναπτυχθεί τοπικά
  3. Ικανότητα αντιπροσώπευσης, όχι απλώς διάλογος
  4. Κόστος μόνο 5% των ανταγωνιστών

Υπάρχει μια ενδιαφέρουσα πρόβλεψη στο X:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225GB VRAM, μπορεί να τρέξει σε έναν υπολογιστή. Αυτό σημαίνει ότι οι μικρομεσαίοι προγραμματιστές μπορούν για πρώτη φορά να έχουν πρόσβαση σε ένα μοντέλο κοντά στο επίπεδο GPT-5.

Το πραγματικό ερώτημα δεν είναι αν το Qwen 3.5 μπορεί να νικήσει το GPT-5.3, αλλά: πώς θα βγάλουν χρήματα οι εταιρείες AI όταν το κόστος των κορυφαίων μοντέλων πέσει σχεδόν στο μηδέν;

Published in Technology

You Might Also Like

Πώς να χρησιμοποιήσετε την τεχνολογία υπολογιστικού νέφους: Ο πλήρης οδηγός για την κατασκευή της πρώτης σας υποδομής νέφουςTechnology

Πώς να χρησιμοποιήσετε την τεχνολογία υπολογιστικού νέφους: Ο πλήρης οδηγός για την κατασκευή της πρώτης σας υποδομής νέφους

[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLD...

Προειδοποίηση! Ο πατέρας του Claude Code δηλώνει: Σε 1 μήνα, χωρίς το Plan Mode, ο τίτλος του λογισμικού μηχανικού θα εξαφανιστείTechnology

Προειδοποίηση! Ο πατέρας του Claude Code δηλώνει: Σε 1 μήνα, χωρίς το Plan Mode, ο τίτλος του λογισμικού μηχανικού θα εξαφανιστεί

Προειδοποίηση! Ο πατέρας του Claude Code δηλώνει: Σε 1 μήνα, χωρίς το Plan Mode, ο τίτλος του λογισμικού μηχανικού θα εξ...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026年 Top 10 AI 代理:核心卖点解析Technology

2026年 Top 10 AI 代理:核心卖点解析

2026年 Top 10 AI 代理:核心卖点解析 引言 Με την ταχεία ανάπτυξη της τεχνητής νοημοσύνης, οι AI代理 (AI Agents) έχουν γίνει ένα καυτό θ...

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力Technology

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力 在技术飞速发展的今天,人工智能(AI)已成为各行各业的热门话题。从医疗健康到金融服务,从教育到娱乐,AI 工具正在改变我们工作的方式。为此,我们整理出2026年值得关注的十大...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 在快速发展的云计算领域,Amazon Web Services (AWS) 一直是领军者,提供丰富的服务和工具,帮助开发者、企业和技术专家在云上有效工作。以下是2026年值得关注的十大AWS工...