Probé MiniMax M2.5 y empecé a dudar si renovar Claude...

2/15/2026
8 min read

¡Salió MiniMax M2.5! Lo primero que hice fue conectarlo a Claude Code para probarlo.

Esta vez es realmente diferente, el informe oficial de MiniMax es bastante explosivo.

Obtuvo un 80.2% en SWE-Bench Verified, el primer lugar directamente en programación multilingüe Multi-SWE-Bench, y la capacidad de búsqueda BrowseComp también está en el nivel SOTA con un 76.3%.

Peter Steinberger, fundador de OpenClaw, ya había recomendado varias veces la serie de modelos MiniMax en entrevistas. Esta vez, cuando salió M2.5, reenvió directamente una publicación:

"MiniMax acaba de lanzar MiniMaxM2.5, ¡su rendimiento es comparable al de Opus4.6 y el precio es 20 veces más barato!"

Realmente quiero recomendarles a todos que lo prueben por sí mismos, ¡M2.5 es completamente un dios para los desarrolladores, con una capacidad de desarrollo muy fuerte!

Después de usar M2.5, comencé a dudar si era necesario renovar Claude el próximo mes...

Ventajas principales

La estética y la integridad de M2.5 son muy altas, especialmente experto en el manejo de algunas necesidades de desarrollo muy complejas. Todos pueden ver mi segundo caso en un momento, se completó de manera excelente, y en ese momento solo tomó unos 20 minutos.

El nombre oficial de MiniMax M2.5 es arquitectura nativa de agente inteligente, en otras palabras, este modelo está destinado a trabajar.

Su cantidad de parámetros de activación es de solo 10B. En comparación, los modelos insignia como Claude Opus 4 tienen cientos de B de parámetros. Pero M2.5 puede competir con los buques insignia de primer nivel en programación, procesamiento de documentos y ejecución de tareas complejas.

Casualmente, recientemente observé que muchos amigos a mi alrededor están haciendo algunos proyectos de desarrollo de sitios web o plataformas comerciales, y también tienen que gastar dinero para encontrar subcontratistas.

Pero debo decir que MiniMax M2.5 puede hacer todo este trabajo, y el efecto no es peor que muchas plataformas en línea...

Ejecuté 3 escenarios de prueba, que cubren el desarrollo de sitios web personales, la construcción de plataformas comerciales y la construcción de plataformas de educación en línea. Veamos cómo es el efecto de combate real de MiniMax M2.5 👇

Casos prácticos

Caso 1: Una bloguera de belleza quiere hacer un sitio web de marca personal

Hace algún tiempo, un amigo que trabaja en medios de autoexpresión de belleza me consultó y me dijo que quería usar IA para construir un sitio web personal para mostrar algunos de sus trabajos en redes sociales, para que la parte A los vea fácilmente. // Parte A hace referencia a la contraparte o cliente en un acuerdo comercial.

Pero ella no entiende nada de código, y las cotizaciones externas comienzan en miles.

Con base en esta necesidad, quería probar si podía usar MiniMax M2.5 directamente en un solo paso.

Primero planificó la pila de tecnología y la estructura de directorios de todo el sitio web, y luego comenzó a generar código página por página.

En algunos lugares, tomará la iniciativa de optimizar, como ajustar automáticamente el número de columnas del flujo de cascada en el lado móvil y agregar animaciones de transición suaves al fondo degradado.

Todo el proceso tomó solo más de tres minutos y generó código HTML, CSS y diseño receptivo completo.

Se puede ver que el valor práctico es realmente obvio, especialmente para los bloggers personales y los pequeños estudios con presupuestos limitados, esta capacidad reduce directamente el costo de construcción del sitio de decenas de miles de yuanes a cero. // Yuanes es la moneda china.

Solo necesita plantear las necesidades, y todo el trabajo técnico restante se deja a la IA.

Caso 2: Sistema complejo de plataforma de cooperación comercial KOL

La dificultad de este caso ha subido un nivel. Lo que quiero probar es si puede manejar productos de plataforma con lógica comercial real, no solo hacer un sitio web de exhibición.Solicito la creación de una plataforma de colaboración comercial KOL, que muestre un panel de datos de influencers con perfiles de audiencia y cotizaciones, un sistema de coincidencia inteligente que permita a las marcas ingresar sus necesidades y que la IA recomiende KOLs adecuados, un calendario de programación que muestre visualmente la disponibilidad de los próximos tres meses, además de una biblioteca de plantillas de contratos e informes de seguimiento de datos.

El estilo visual debe ser similar al diseño de tarjetas de Instagram combinado con el estilo de panel de control de un SaaS B2B.

Su enfoque es más sistemático que el del primer caso.

Primero, se desglosan los módulos de funciones y se diseñan los subsistemas de panel de datos, algoritmo de coincidencia, componente de calendario y gestión de documentos, respectivamente. // Descomposición de los módulos funcionales y diseño de subsistemas

Luego, se conectan en el frontend utilizando un diseño de flujo de tarjetas, y la lógica del backend se ejecuta a través de datos simulados para completar todo el proceso. // Conexión en el frontend y ejecución de la lógica del backend

Lo interesante es que, al crear la función de coincidencia inteligente, diseña proactivamente una versión simplificada del algoritmo de recomendación. Aunque no es un modelo de aprendizaje automático real, la lógica basada en la coincidencia de etiquetas ya puede mostrar el concepto central. // Diseño de un algoritmo de recomendación simplificado

Todo el proyecto tardó aproximadamente 20 minutos en desarrollarse. Con este nivel de complejidad, si se contratara a un equipo de desarrollo, tomaría al menos uno o dos meses.

Y debo decir que esta capacidad es de gran valor para los emprendedores.

Si tienes una idea de negocio y quieres crear rápidamente un MVP (Producto Mínimo Viable) para validar el mercado, puedes utilizar este método para construir primero el prototipo del producto y luego decidir si invertir recursos en el desarrollo formal.

Caso 3: Plataforma de educación en línea de estética china moderna

En el tercer caso, quiero probar su desempeño en la dirección creativa cultural. Este tipo de demanda no solo implica la implementación de funciones, sino también la estética y la creación de ambiente, que a menudo son las debilidades de la IA.

Solicito la creación de un sitio web para la plataforma de educación en línea de estudios chinos clásicos Shiguang Shuyuan, que tenga una estética china moderna. Los colores deben ser blanco hueso, tinta y degradado rojo bermellón, el fondo debe contener obras de caligrafía o paisajes de tinta, con un efecto de dispersión de partículas. Incorporar elementos de libros antiguos como rollos de bambú y sellos, y el texto debe estar en formato vertical con fuente Song. Cada marco de visualización del curso debe ser como un libro cosido con hilo, con videos de guqin o ceremonia del té reproduciéndose en el fondo. El ambiente general debe ser refinado y tranquilo, como si estuvieras degustando té y discutiendo filosofía en un estudio.

Durante la ejecución, demostró su capacidad para comprender los símbolos culturales.

Además de implementar el estilo visual básico, también hace ajustes en los detalles, como agregar animaciones de transición de difuminado de tinta a los cambios de página, agregar etiquetas estilo sello a las tarjetas de curso e incluso activar animaciones de ruta de escritura con pincel al pasar el mouse.

Estos pequeños detalles le dan espíritu a toda la página, en lugar de ser una simple acumulación de código.

El resultado fue que le mostré esta demostración a un amigo que trabaja en comunicación cultural, y su primera reacción fue preguntarme qué agencia de diseño había contratado.

Cuando le dije que esto lo había hecho la IA, no lo creyó en absoluto.

Por eso digo que la velocidad de evolución de la IA en el nivel estético puede estar subestimada. No solo está imitando el diseño humano, sino que realmente está comprendiendo la connotación cultural y la expresión emocional.

Resumen

Después de probar estos casos, siento que la capacidad de ejecución de MiniMax M2.5 es realmente sólida.

Puede entender requisitos complejos, planificar los pasos de la tarea por sí mismo y es increíblemente rápido. La información oficial dice que la velocidad de inferencia es 3 veces mayor que la de Opus, y según mis pruebas, realmente tengo esa sensación.

Si también te sientes constantemente retrasado por las trivialidades de la capa de ejecución, te recomiendo encarecidamente que lo pruebes tú mismo. Ahora la interfaz API también está abierta, la clave es ver si realmente puede integrarse en tu flujo de trabajo.

Para ser honesto, en esta etapa del desarrollo de la IA, la pregunta ya no es si se puede usar, sino si se sabe cómo usarla.Empieza temprano, benefíciate temprano.

Published in Technology

You Might Also Like