Testei o MiniMax M2.5 e comecei a duvidar se ainda preciso renovar o Claude...

2/15/2026
10 min read

MiniMax M2.5 foi lançado! Fui o primeiro a conectar ao Claude Code para testá-lo.

Desta vez é realmente diferente, o boletim oficial do MiniMax é bastante explosivo.

O SWE-Bench Verified obteve 80,2%, a programação multilíngue Multi-SWE-Bench ficou em primeiro lugar e a capacidade de pesquisa BrowseComp também está no nível SOTA de 76,3%.

O fundador da OpenClaw, Peter Steinberger, já havia recomendado a série de modelos MiniMax em várias entrevistas. Desta vez, quando o M2.5 foi lançado, ele encaminhou diretamente uma postagem:

"MiniMax acaba de lançar o MiniMaxM2.5, cujo desempenho é comparável ao do Opus4.6, mas o preço é 20 vezes menor!"

Eu realmente quero recomendar fortemente que todos experimentem por si mesmos. O M2.5 é totalmente uma dádiva para os desenvolvedores, com uma capacidade de desenvolvimento muito forte!

Depois de usar o M2.5, comecei a duvidar se ainda é necessário renovar o Claude no próximo mês...

Principais vantagens

A estética e a completude do M2.5 são muito altas, especialmente em lidar com algumas necessidades de desenvolvimento muito complexas. Todos podem ver meu segundo caso em breve, que foi concluído de forma excelente. Naquela época, levou apenas cerca de 20 minutos.

O oficial chama o MiniMax M2.5 de arquitetura nativa de agente inteligente. Em outras palavras, este modelo nasceu para trabalhar.

Sua quantidade de parâmetros de ativação é de apenas 10B. Em contraste, modelos emblemáticos como o Claude Opus 4 têm centenas de B de parâmetros. Mas o M2.5 pode competir com os principais modelos emblemáticos em programação, processamento de documentos e execução de tarefas complexas.

Por coincidência, observei recentemente que muitos amigos ao meu redor estão fazendo alguns projetos de desenvolvimento de sites ou plataformas de comercialização e ainda precisam gastar dinheiro para encontrar terceirizados.

Mas devo dizer que o MiniMax M2.5 pode fazer esses trabalhos e o efeito não é inferior a muitas plataformas online...

Executei 3 cenários de teste, cobrindo o desenvolvimento de sites pessoais, a construção de plataformas comerciais e a construção de plataformas de educação online. Vamos ver como é o efeito prático do MiniMax M2.5 👇

Casos práticos

Case 1: Uma blogueira de beleza quer criar um site de marca pessoal

Recentemente, um amigo que trabalha com mídia independente de beleza me consultou, dizendo que queria usar IA para construir um site pessoal para exibir alguns de seus trabalhos de mídia social para facilitar a visualização para a Parte A. // Parte A se refere ao cliente

Mas ela não entende nada de código e as cotações de terceirizados começam em milhares.

Com base nessa necessidade, queria testar se poderia usar diretamente o MiniMax M2.5 em uma única etapa.

Ele primeiro planejou a pilha de tecnologia e a estrutura de diretórios de todo o site e, em seguida, começou a gerar código para cada página.

Em alguns lugares, ele otimizará ativamente, como ajustar automaticamente o número de colunas do layout em cascata no lado móvel e adicionar animações de transição suave ao fundo gradiente.

Todo o processo levou apenas mais de três minutos, gerando HTML, CSS e código de layout responsivo completos.

Portanto, o valor prático é realmente óbvio, especialmente para blogueiros pessoais e pequenos estúdios com orçamentos limitados. Essa capacidade reduz diretamente o custo de construção do site de dezenas de milhares de yuans para zero. // Moeda chinesa

Você só precisa apresentar as necessidades e todo o trabalho técnico é entregue à IA.

Case 2: Sistema complexo de plataforma de cooperação comercial KOL

Este caso é um nível mais difícil. O que quero testar é se ele pode lidar com produtos de plataforma com lógica de negócios real, em vez de apenas fazer um site de exibição.Eu quero criar uma plataforma de colaboração comercial KOL, com um painel de dados de influenciadores mostrando o perfil dos fãs e cotações, um sistema de correspondência inteligente que permita que as marcas insiram suas necessidades e a IA recomende KOLs adequados, um calendário de agendamento exibindo visualmente o agendamento dos próximos três meses, e também um banco de modelos de contrato e relatórios de rastreamento de dados.

O estilo visual deve ser como um layout de cartão do Instagram, combinado com o estilo de painel de controle de um B2B SaaS.

Sua abordagem é mais sistemática do que o primeiro caso.

Primeiro, os módulos funcionais são decompostos e os subsistemas de painel de dados, algoritmo de correspondência, componente de calendário e gerenciamento de documentos são projetados separadamente.

Em seguida, eles são conectados no frontend usando um layout de fluxo de cartão, e a lógica de backend executa todo o processo com dados simulados.

Curiosamente, ao fazer a função de correspondência inteligente, ele projeta proativamente uma versão simplificada do algoritmo de recomendação. Embora não seja um modelo de aprendizado de máquina real, a lógica baseada na correspondência de tags já pode exibir o conceito central. (Embora não seja um modelo de machine learning real, a lógica baseada na correspondência de tags já pode exibir o conceito central.)

Todo o projeto levou cerca de 20 minutos para ser desenvolvido. Com esse nível de complexidade, se você encontrar uma equipe de desenvolvimento, quase não conseguirá terminar em um ou dois meses. (Com esse nível de complexidade, se você encontrar uma equipe de desenvolvimento, quase não conseguirá terminar em um ou dois meses.)

E devo dizer que essa capacidade é de grande valor para os empreendedores.

Se você tem uma ideia de negócio e quer fazer rapidamente um MVP para validar o mercado, você pode usar esse método para construir o protótipo do produto primeiro e, em seguida, decidir se deve investir recursos para fazer o desenvolvimento formal. (Se você tem uma ideia de negócio e quer fazer rapidamente um MVP para validar o mercado, você pode usar esse método para construir o protótipo do produto primeiro e, em seguida, decidir se deve investir recursos para fazer o desenvolvimento formal.)

Case 3: Plataforma de educação online de estética chinesa moderna

No terceiro caso, quero testar seu desempenho na direção criativa cultural. Esse tipo de demanda não envolve apenas a implementação de funções, mas também a estética e a criação de atmosfera, que geralmente são as fraquezas da IA. (No terceiro caso, quero testar seu desempenho na direção criativa cultural. Esse tipo de demanda não envolve apenas a implementação de funções, mas também a estética e a criação de atmosfera, que geralmente são as fraquezas da IA.)

Eu solicito a criação de um site para a plataforma de educação online de estudos chineses clássicos Shiguang Shuyuan, com estética chinesa moderna. As cores devem ser branco-arroz, tinta e vermelho-cinábrio em gradiente, o fundo deve conter caligrafia ou paisagens de tinta, com um efeito de dispersão de partículas. Integre elementos de livros antigos, como rolos de bambu e selos, e o texto deve ser formatado verticalmente em fonte Song. Cada caixa de exibição do curso deve ser como um livro encadernado com linha, e o fundo deve reproduzir vídeos de guqin ou cerimônia do chá. A atmosfera geral deve ser refinada e tranquila, como se estivesse bebendo chá e discutindo doutrinas em um estudo. (Eu solicito a criação de um site para a plataforma de educação online de estudos chineses clássicos Shiguang Shuyuan, com estética chinesa moderna. As cores devem ser branco-arroz, tinta e vermelho-cinábrio em gradiente, o fundo deve conter caligrafia ou paisagens de tinta, com um efeito de dispersão de partículas. Integre elementos de livros antigos, como rolos de bambu e selos, e o texto deve ser formatado verticalmente em fonte Song. Cada caixa de exibição do curso deve ser como um livro encadernado com linha, e o fundo deve reproduzir vídeos de guqin ou cerimônia do chá. A atmosfera geral deve ser refinada e tranquila, como se estivesse bebendo chá e discutindo doutrinas em um estudo.)

Durante a execução, ele demonstrou uma capacidade de entender símbolos culturais. (Durante a execução, ele demonstrou uma capacidade de entender símbolos culturais.)

Além de implementar o estilo visual básico, ele também faz um esforço extra nos detalhes, como adicionar animações de transição de tinta para a troca de página, adicionar rótulos de estilo de selo nos cartões do curso e até mesmo acionar animações de caminho de escrita com pincel quando o mouse paira sobre eles. (Além de implementar o estilo visual básico, ele também faz um esforço extra nos detalhes, como adicionar animações de transição de tinta para a troca de página, adicionar rótulos de estilo de selo nos cartões do curso e até mesmo acionar animações de caminho de escrita com pincel quando o mouse paira sobre eles.)

Esses pequenos pensamentos tornam toda a página espirituosa, não apenas uma pilha fria de código. (Esses pequenos pensamentos tornam toda a página espirituosa, não apenas uma pilha fria de código.)

O resultado é que mostrei esta demonstração para um amigo que trabalha com comunicação cultural, e sua primeira reação foi me perguntar qual empresa de design eu havia contratado. (O resultado é que mostrei esta demonstração para um amigo que trabalha com comunicação cultural, e sua primeira reação foi me perguntar qual empresa de design eu havia contratado.)

Quando eu disse a ela que foi feito por IA, ela não acreditou.

Então eu digo, a velocidade de evolução da IA no nível estético pode ser subestimada. Não está apenas imitando o design humano, mas realmente entendendo a conotação cultural e a expressão emocional. (Então eu digo, a velocidade de evolução da IA no nível estético pode ser subestimada. Não está apenas imitando o design humano, mas realmente entendendo a conotação cultural e a expressão emocional.)

Resumo

Depois de testar esses casos, sinto que a capacidade da camada de execução do MiniMax M2.5 é realmente forte.

Ele pode entender requisitos complexos, pode planejar as etapas da tarefa sozinho e a velocidade é absurdamente rápida. A declaração oficial é que a velocidade de inferência é 3 vezes maior que a do Opus, e sinto que é verdade depois de testá-lo. (Ele pode entender requisitos complexos, pode planejar as etapas da tarefa sozinho e a velocidade é absurdamente rápida. A declaração oficial é que a velocidade de inferência é 3 vezes maior que a do Opus, e sinto que é verdade depois de testá-lo.)

Se você também é frequentemente prejudicado por tarefas triviais na camada de execução, eu recomendo fortemente que você teste pessoalmente. Agora a interface da API também foi aberta. A chave é ver se ela pode realmente se integrar ao seu fluxo de trabalho. (Se você também é frequentemente prejudicado por tarefas triviais na camada de execução, eu recomendo fortemente que você teste pessoalmente. Agora a interface da API também foi aberta. A chave é ver se ela pode realmente se integrar ao seu fluxo de trabalho.)

Para ser honesto, o desenvolvimento da IA atingiu o estágio atual, não é mais uma questão de se pode ser usada, mas sim de como usá-la. (Para ser honesto, o desenvolvimento da IA atingiu o estágio atual, não é mais uma questão de se pode ser usada, mas sim de como usá-la.)Comece cedo, beneficie-se cedo.

Published in Technology

You Might Also Like