Κυκλοφόρησε το Qwen 3.5: Ένα μοντέλο ανοιχτού βάρους με 397B παραμέτρους, με 60% μειωμένο κόστος
Η Alibaba μόλις κυκλοφόρησε το Qwen 3.5-397B-A17B. Αυτό είναι το πρώτο μοντέλο ανοιχτού βάρους της σειράς Qwen 3.5.
Βασικά Δεδομένα
- Συνολικές Παράμετροι: 397B
- Ενεργές Παράμετροι: 17B ανά πέρασμα (αραιό MoE)
- Ροή Δεδομένων: 8.6x-19x βελτίωση σε σχέση με το Qwen 3-Max
- Κόστος: 60% μείωση σε σχέση με το Qwen 3
- Υποστήριξη Γλωσσών: 201 γλώσσες (επέκταση από 119)
Δεν είναι απλή στοίβαξη παραμέτρων. Είναι επαναπροσδιορισμός της αποδοτικότητας.

Αρχιτεκτονική Καινοτομία
Το Qwen 3.5 χρησιμοποιεί υβριδική αρχιτεκτονική:
- Gated Delta Networks + αραιό MoE
- Υβριδική Γραμμική Προσοχή: Οι περισσότερες στρώσεις χρησιμοποιούν γραμμική προσοχή, κάθε 4 στρώσεις χρησιμοποιούν πλήρη προσοχή
- Εγγενής Πολυτροπικότητα: Δεν προστέθηκε αργότερα, αλλά εκπαιδεύτηκε από την αρχή
Υπάρχει τεχνική ανάλυση στο X:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Η σημασία αυτής της αρχιτεκτονικής είναι: να επιτευχθεί απόδοση μοντέλου κοντά στα 400B με 17B ενεργές παραμέτρους. Το κόστος συμπερασμού μειώνεται σημαντικά.
Ισχυρισμοί Απόδοσης
Η Alibaba ισχυρίζεται ότι το Qwen 3.5 νίκησε:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
Ανεξάρτητοι δοκιμαστές στο X άρχισαν να το επαληθεύουν:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Αλλά το πιο κρίσιμο δεν είναι τα benchmarks, αλλά η ικανότητα αντιπροσώπευσης:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Εποχή των Αντιπροσώπων
Η θέση του Qwen 3.5 είναι ξεκάθαρη: σχεδιασμένο για την εποχή των αντιπροσώπων.
- Μπορεί να αναλύσει 2 ώρες βίντεο
- Μπορεί να εκτελέσει ανεξάρτητα εργασίες σε εφαρμογές
- Μπορεί να κατανοήσει το GUI και να αλληλεπιδράσει μαζί του
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
Αυτό σημαίνει ότι δεν είναι ένα «chatbot», αλλά ένας «εκτελεστής εργασιών».
Ανταγωνιστικό Τοπίο
Κάποιος στο X συνόψισε τις κυκλοφορίες AI αυτής της εβδομάδας:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Ο ρυθμός των κινεζικών κατασκευαστών μοντέλων είναι σαφής:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Κάθε εβδομάδα υπάρχει ένα νέο μοντέλο, και κάθε φορά ισχυρίζονται ότι νικούν το GPT. Δεν είναι μάρκετινγκ, είναι αναβάθμιση του πολέμου κόστους.
Δομή Κόστους
Η τιμή token του Qwen 3.5 είναι μόνο το 1/18 του Gemini 3 Pro.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Όταν η απόδοση είναι κοντά και το κόστος είναι μόνο 5%, πού είναι το χαντάκι των κλειστών μοντέλων;
Σύνοψη
Το Qwen 3.5 δεν είναι το «κινεζικό GPT». Είναι ανατροπέας της δομής κόστους:
- 397B παράμετροι, αλλά ενεργοποιούνται μόνο 17B
- Ανοιχτό βάρος, μπορεί να αναπτυχθεί τοπικά
- Ικανότητα αντιπροσώπευσης, όχι απλώς διάλογος
- Κόστος μόνο 5% των ανταγωνιστών
Υπάρχει μια ενδιαφέρουσα πρόβλεψη στο X:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
225GB VRAM, μπορεί να τρέξει σε έναν υπολογιστή. Αυτό σημαίνει ότι οι μικρομεσαίοι προγραμματιστές μπορούν για πρώτη φορά να έχουν πρόσβαση σε ένα μοντέλο κοντά στο επίπεδο GPT-5.
Το πραγματικό ερώτημα δεν είναι αν το Qwen 3.5 μπορεί να νικήσει το GPT-5.3, αλλά: πώς θα βγάλουν χρήματα οι εταιρείες AI όταν το κόστος των κορυφαίων μοντέλων πέσει σχεδόν στο μηδέν;





