Qwen 3.5 リリース:397Bパラメータのオープンウェイトモデル、コスト60%削減
アリババは、Qwen 3.5-397B-A17Bをリリースしました。これは、Qwen 3.5シリーズ初のオープンウェイトモデルです。
コアデータ
- 総パラメータ数:397B
- アクティブパラメータ数:17B per pass(スパースMoE)
- スループット:Qwen 3-Maxより8.6x-19x向上
- コスト:Qwen 3より60%削減
- 言語サポート:201言語(119言語から拡張)
これは単なるパラメータの積み重ねではありません。これは効率の再定義です。

アーキテクチャの革新
Qwen 3.5は、ハイブリッドアーキテクチャを使用しています。
- Gated Delta Networks + スパースMoE
- ハイブリッド線形アテンション:ほとんどのレイヤーで線形アテンションを使用し、4レイヤーごとに完全なアテンションを使用
- ネイティブマルチモーダル:後から追加されたものではなく、最初からトレーニング
Xには技術分析があります。
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
このアーキテクチャの意義は、17Bのアクティブパラメータで400Bモデルに近い性能を実現することです。推論コストが大幅に削減されます。
性能の主張
アリババは、Qwen 3.5が以下を打ち負かしたと主張しています。
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
X上の独立したテスターが検証を開始しています。
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
しかし、最も重要なのはベンチマークではなく、エージェント能力です。
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
エージェント時代
Qwen 3.5のポジショニングは明確です。エージェント時代のために設計されています。
- 2時間のビデオを分析できる
- アプリケーションを跨いだタスクを独立して実行できる
- GUIを理解し、インタラクトできる
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
これは、それが「チャットボット」ではなく、「タスク実行者」であることを意味します。
競争環境
X上では、今週のAIリリースがまとめられています。
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
中国のモデルメーカーのリズムは明確です。
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
毎週新しいモデルが登場し、毎回GPTを打ち負かしたと主張しています。これはマーケティングではなく、コスト戦争のエスカレーションです。
コスト構造
Qwen 3.5のトークン価格は、Gemini 3 Proの1/18に過ぎません。
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
性能が近く、コストがわずか5%の場合、クローズドソースモデルの堀はどこにあるのでしょうか?
結論
Qwen 3.5は「中国のGPT」ではありません。それはコスト構造の破壊者です。
- 397Bパラメータだが、アクティブなのは17Bのみ
- オープンウェイト、ローカルにデプロイ可能
- エージェント能力、単なる会話ではない
- コストは競合他社の5%に過ぎない
X上には興味深い予測があります。
"Qwen 3.5 Q4 バージョンはわずか 225G で済み、非常に実用的です" — @janxin
225GBのVRAMで、シングルマシンで実行できます。これは、中小規模の開発者が初めてGPT-5レベルに近いモデルに触れることができることを意味します。
真の問題は、Qwen 3.5がGPT-5.3を打ち負かすことができるかどうかではなく、**トップモデルのコストがほぼゼロになったとき、AI企業はどのように収益を上げるのか?**ということです。





