Qwen 3.5 Ra Mắt: Mô Hình Trọng Số Mở 397B Tham Số, Chi Phí Giảm 60%

2/16/2026
4 min read

Alibaba vừa mới phát hành Qwen 3.5-397B-A17B. Đây là mô hình trọng số mở đầu tiên của dòng Qwen 3.5.

Dữ liệu cốt lõi

  • Tổng số tham số: 397B
  • Tham số kích hoạt: 17B per pass (MoE thưa thớt)
  • Thông lượng: Tăng 8.6x-19x so với Qwen 3-Max
  • Chi phí: Giảm 60% so với Qwen 3
  • Hỗ trợ ngôn ngữ: 201 ngôn ngữ (mở rộng từ 119 ngôn ngữ)

Đây không chỉ đơn giản là việc xếp chồng các tham số. Đây là định nghĩa lại hiệu quả.

Qwen 3.5

Đổi mới kiến trúc

Qwen 3.5 sử dụng kiến trúc hỗn hợp:

  • Gated Delta Networks + MoE thưa thớt
  • Chú ý tuyến tính hỗn hợp: Hầu hết các lớp sử dụng chú ý tuyến tính, mỗi 4 lớp sử dụng chú ý đầy đủ
  • Đa phương thức gốc: Không phải thêm vào sau, mà là huấn luyện từ đầu

Trên X có phân tích kỹ thuật:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Ý nghĩa của kiến trúc này là: Sử dụng 17B tham số kích hoạt để đạt được hiệu suất gần với mô hình 400B. Chi phí suy luận giảm đáng kể.

Tuyên bố hiệu suất

Alibaba tuyên bố Qwen 3.5 đánh bại:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Những người thử nghiệm độc lập trên X bắt đầu xác minh:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Nhưng điều quan trọng nhất không phải là điểm chuẩn, mà là khả năng đại diện:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Kỷ nguyên đại diện

Định vị của Qwen 3.5 rất rõ ràng: Được thiết kế cho kỷ nguyên đại diện.

  • Có thể phân tích video 2 giờ
  • Có thể độc lập thực hiện các tác vụ trên các ứng dụng
  • Có thể hiểu GUI và tương tác với nó

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Điều này có nghĩa là nó không phải là "chatbot", mà là "trình thực thi tác vụ".

Bối cảnh cạnh tranh

Trên X có người tóm tắt các bản phát hành AI trong tuần này:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Tốc độ của các nhà sản xuất mô hình Trung Quốc rất rõ ràng:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Mỗi tuần đều có mô hình mới, mỗi lần đều tuyên bố đánh bại GPT. Đây không phải là marketing, đây là sự leo thang của cuộc chiến chi phí.

Cấu trúc chi phí

Giá token của Qwen 3.5 chỉ bằng 1/18 so với Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Khi hiệu suất gần bằng nhau, chi phí chỉ bằng 5%, hào bảo vệ của mô hình nguồn đóng ở đâu?

Điểm mấu chốt

Qwen 3.5 không phải là "GPT của Trung Quốc". Nó là kẻ phá vỡ cấu trúc chi phí:

  1. 397B tham số, nhưng chỉ kích hoạt 17B
  2. Trọng số mở, có thể triển khai cục bộ
  3. Khả năng đại diện, không chỉ là đối thoại
  4. Chi phí chỉ bằng 5% so với đối thủ cạnh tranh

Trên X có một dự đoán thú vị:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225GB VRAM, có thể chạy trên một máy. Điều này có nghĩa là các nhà phát triển vừa và nhỏ lần đầu tiên có thể tiếp cận mô hình gần cấp GPT-5.

Câu hỏi thực sự không phải là Qwen 3.5 có thể đánh bại GPT-5.3 hay không, mà là: Khi chi phí của các mô hình hàng đầu giảm xuống gần bằng không, các công ty AI kiếm tiền bằng cách nào?

Published in Technology

You Might Also Like

Cách sử dụng công nghệ điện toán đám mây: Hướng dẫn đầy đủ để xây dựng cơ sở hạ tầng đám mây đầu tiên của bạnTechnology

Cách sử dụng công nghệ điện toán đám mây: Hướng dẫn đầy đủ để xây dựng cơ sở hạ tầng đám mây đầu tiên của bạn

Cách sử dụng công nghệ điện toán đám mây: Hướng dẫn đầy đủ để xây dựng cơ sở hạ tầng đám mây đầu tiên của bạn Giới thiệu...

Cảnh báo! Cha đẻ của Claude Code thẳng thắn: Một tháng nữa không dùng Plan Mode, danh hiệu kỹ sư phần mềm sẽ biến mấtTechnology

Cảnh báo! Cha đẻ của Claude Code thẳng thắn: Một tháng nữa không dùng Plan Mode, danh hiệu kỹ sư phần mềm sẽ biến mất

Cảnh báo! Cha đẻ của Claude Code thẳng thắn: Một tháng nữa không dùng Plan Mode, danh hiệu kỹ sư phần mềm sẽ biến mất G...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

Top 10 AI đại lý năm 2026: Phân tích điểm bán hàng cốt lõiTechnology

Top 10 AI đại lý năm 2026: Phân tích điểm bán hàng cốt lõi

Top 10 AI đại lý năm 2026: Phân tích điểm bán hàng cốt lõi Giới thiệu Với sự phát triển nhanh chóng của trí tuệ nhân tạo...

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力Technology

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力 Trong thời đại công nghệ phát triển nhanh chóng ngày nay, trí tuệ nhân tạo (AI) đã trở ...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 Trong lĩnh vực điện toán đám mây đang phát triển nhanh chóng, Amazon Web Services (AWS) luôn là ...