Qwen 3.5 Lançado: Modelo de Peso Aberto de 397B Parâmetros, Custo Reduzido em 60%

A Alibaba acaba de lançar o Qwen 3.5-397B-A17B. Este é o primeiro modelo de peso aberto da série Qwen 3.5.

Dados Essenciais

Parâmetros Totais: 397B
Parâmetros Ativos: 17B per pass (MoE esparso)
Throughput: 8.6x-19x maior que o Qwen 3-Max
Custo: 60% menor que o Qwen 3
Suporte a Idiomas: 201 (expandido de 119)

Isto não é simplesmente empilhar parâmetros. É uma redefinição de eficiência.

Qwen 3.5

Inovação na Arquitetura

O Qwen 3.5 usa uma arquitetura híbrida:

Gated Delta Networks + MoE esparso
Atenção Linear Híbrida: A maioria das camadas usa atenção linear, cada 4 camadas usa atenção total
Multimodal Nativo: Não é adicionado posteriormente, mas treinado desde o início

Existem análises técnicas no X:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

O significado desta arquitetura é: alcançar o desempenho de um modelo de quase 400B com 17B de parâmetros ativos. Os custos de inferência são drasticamente reduzidos.

Alegações de Desempenho

A Alibaba afirma que o Qwen 3.5 derrotou:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

Testadores independentes no X começaram a validar:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Mas o mais importante não são os benchmarks, mas sim a capacidade de agente:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Era do Agente

O posicionamento do Qwen 3.5 é claro: projetado para a era do agente.

Pode analisar 2 horas de vídeo
Pode executar tarefas entre aplicativos de forma independente
Pode entender e interagir com GUIs

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Isso significa que não é um "chatbot", mas sim um "executor de tarefas".

Cenário Competitivo

Alguém no X resumiu os lançamentos de IA desta semana:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

O ritmo dos fabricantes de modelos chineses é claro:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

Há um novo modelo a cada semana, e cada um afirma derrotar o GPT. Isso não é marketing, é uma escalada na guerra de custos.

Estrutura de Custos

O preço do token do Qwen 3.5 é apenas 1/18 do Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Quando o desempenho é próximo e o custo é de apenas 5%, onde está o fosso dos modelos de código fechado?

Conclusão

Qwen 3.5 não é o "GPT chinês". É um disruptor da estrutura de custos:

397B parâmetros, mas apenas 17B ativados
Peso aberto, pode ser implantado localmente
Capacidade de agente, não apenas diálogo
Custo é apenas 5% dos concorrentes

Há uma previsão interessante no X:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

225GB de VRAM, pode ser executado em uma única máquina. Isso significa que pequenos e médios desenvolvedores podem acessar pela primeira vez um modelo próximo ao nível do GPT-5.

A verdadeira questão não é se o Qwen 3.5 pode derrotar o GPT-5.3, mas sim: como as empresas de IA ganham dinheiro quando o custo dos modelos de ponta cai para perto de zero?

Qwen 3.5 Lançado: Modelo de Peso Aberto de 397B Parâmetros, Custo Reduzido em 60%

Dados Essenciais

Inovação na Arquitetura

Alegações de Desempenho

Era do Agente

Cenário Competitivo

Estrutura de Custos

Conclusão

You Might Also Like

Guia de Modificação do Claude Code Buddy: Como Obter um Pet Lendário Brilhante

Obsidian lançou Defuddle, elevando o Obsidian Web Clipper a um novo patamar

OpenAI de repente anuncia 'três em um': fusão de navegador + programação + ChatGPT, reconhecendo internamente que errou no último ano

2026, não se force mais a ser "disciplinado"! Faça estas 8 pequenas coisas e a saúde virá naturalmente

Aquelas mães que se esforçam para emagrecer e não conseguem, definitivamente caem aqui

Guia de Funcionamento Estável do Navegador AI 24 Horas