Après avoir testé MiniMax M2.5, je commence à me demander si je dois encore renouveler mon abonnement à Claude...
MiniMax M2.5 est sorti ! Je me suis empressé de le connecter à Claude Code pour le tester.
Cette fois, c'est vraiment différent, les résultats annoncés par MiniMax sont assez explosifs.
Il a obtenu 80,2 % sur SWE-Bench Verified, il est directement premier en programmation multilingue sur Multi-SWE-Bench, et sa capacité de recherche BrowseComp est également au niveau SOTA avec 76,3 %.
Peter Steinberger, fondateur d'OpenClaw, avait déjà recommandé à plusieurs reprises la série de modèles MiniMax lors d'interviews. Cette fois, après la sortie de M2.5, il a directement partagé une publication :
« MiniMax vient de publier MiniMaxM2.5, ses performances sont comparables à celles d'Opus4.6, et son prix est 20 fois moins cher ! »
Je vous recommande vivement de l'essayer vous-même, M2.5 est vraiment un dieu pour les développeurs, sa capacité de développement est très forte !
Après avoir utilisé M2.5, je commence à me demander s'il est encore nécessaire de renouveler mon abonnement à Claude le mois prochain...

Avantages clés
L'esthétique et le niveau d'achèvement de M2.5 sont très élevés, il est particulièrement doué pour traiter des besoins de développement très complexes. Vous pourrez voir mon deuxième cas dans un instant, il l'a réalisé de manière exceptionnelle, cela n'a pris qu'environ 20 minutes.
Les équipes de MiniMax appellent MiniMax M2.5 une architecture native d'agent intelligent. En d'autres termes, ce modèle est né pour travailler.
Son nombre de paramètres actifs n'est que de 10B. En comparaison, les modèles phares comme Claude Opus 4 ont des centaines de B de paramètres. Mais M2.5 peut rivaliser avec les meilleurs modèles phares dans les domaines de la programmation, du traitement de documents et de l'exécution de tâches complexes.
Il se trouve que j'ai récemment observé que de nombreux amis autour de moi, lorsqu'ils réalisent des projets de développement de sites Web ou des plateformes commerciales, doivent encore dépenser de l'argent pour trouver des sous-traitants.
Mais je dois dire que MiniMax M2.5 peut faire tout ce travail, et l'effet n'est pas inférieur à celui de nombreuses plateformes en ligne...
J'ai exécuté 3 scénarios de test, couvrant le développement de sites Web personnels, la construction de plateformes commerciales et la construction de plateformes d'éducation en ligne. Voyons comment MiniMax M2.5 se comporte dans la pratique 👇
Cas pratiques
Cas 1 : Une blogueuse beauté veut créer un site Web de marque personnelle
Il y a quelque temps, une amie qui travaille dans les médias sociaux de beauté m'a contacté pour me demander si je pouvais l'aider à créer un site Web personnel avec l'IA, afin de présenter certains de ses travaux sur les réseaux sociaux et de faciliter la présentation aux clients.
Mais elle ne comprend absolument rien au code, et les devis des sous-traitants externes commencent tous à plusieurs milliers.
Sur la base de ce besoin, j'ai voulu essayer de voir si je pouvais utiliser MiniMax M2.5 directement en une seule étape.
Il a d'abord planifié la pile technologique et la structure du répertoire de l'ensemble du site Web, puis a commencé à générer le code de chaque page.
Dans certains cas, il prend l'initiative d'optimiser, par exemple en ajustant automatiquement le nombre de colonnes du flux en cascade sur le mobile, et en ajoutant une animation de transition en douceur à l'arrière-plan dégradé.
L'ensemble du processus n'a pris qu'environ trois minutes et demie, générant un code HTML, CSS et de mise en page réactive complet.
On peut donc voir que la valeur pratique est vraiment évidente, en particulier pour les blogueurs individuels et les petits studios avec un budget limité, cette capacité réduit directement le coût de construction du site Web de plusieurs dizaines de milliers à zéro.
Il vous suffit de soumettre les exigences, et tout le travail technique est confié à l'IA.
Cas 2 : Système complexe de plateforme de coopération commerciale KOL
La difficulté de ce cas est passée à un niveau supérieur. Ce que je voulais tester, c'est s'il pouvait traiter des produits de type plateforme avec une véritable logique métier, et pas seulement créer un site Web de présentation.Je demande la création d'une plateforme de collaboration commerciale KOL, avec un tableau de bord de données d'influenceurs affichant le profil des fans et les prix, un système de correspondance intelligent permettant aux marques de saisir leurs besoins et à l'IA de recommander les KOL appropriés, un calendrier visuel affichant les plannings des trois prochains mois, ainsi qu'une bibliothèque de modèles de contrats et des rapports de suivi des données.
Le style visuel doit ressembler à une mise en page de cartes Instagram combinée au style tableau de bord d'un SaaS B2B.
Sa méthode de traitement est plus systématique que le premier cas.
Tout d'abord, décomposer les modules fonctionnels et concevoir séparément les sous-systèmes de tableau de bord de données, d'algorithme de correspondance, de composant de calendrier et de gestion de documents.
Ensuite, les relier au frontend avec une mise en page de flux de cartes, et exécuter toute la logique backend avec des données simulées.
Ce qui est intéressant, c'est que lors de la création de la fonction de correspondance intelligente, il concevra activement une version simplifiée de l'algorithme de recommandation. Bien qu'il ne s'agisse pas d'un véritable modèle d'apprentissage automatique, la logique basée sur la correspondance des balises peut déjà montrer le concept central.
L'ensemble du projet a pris environ 20 minutes à développer. Avec ce niveau de complexité, si vous faites appel à une équipe de développement, il faut presque un ou deux mois.
Et je dois dire que cette capacité est d'une valeur énorme pour les entrepreneurs.
Vous avez une idée commerciale et vous souhaitez créer rapidement un MVP pour valider le marché. Vous pouvez utiliser cette méthode pour créer d'abord un prototype de produit, puis décider s'il faut investir des ressources dans un développement formel.

Cas 3 : Plateforme d'éducation en ligne d'esthétique chinoise moderne
Dans le troisième cas, je veux tester sa performance dans la direction créative culturelle. Ce type de demande n'implique pas seulement la réalisation de fonctions, mais aussi l'esthétique et la création d'ambiance, ce qui est souvent le point faible de l'IA.
Je demande la création d'un site web pour la plateforme d'éducation en ligne de culture chinoise classique Shiguang Shuyuan, avec une esthétique chinoise moderne. Les couleurs doivent être blanc cassé, encre et dégradé rouge cinabre, avec des œuvres de calligraphie ou des paysages à l'encre en arrière-plan, et un effet de dispersion de particules. Intégrer des éléments de livres anciens tels que des rouleaux de bambou et des sceaux, et utiliser une version verticale de la police Song. Chaque cadre d'affichage de cours doit ressembler à un livre cousu, avec des vidéos de guqin ou de cérémonie du thé en arrière-plan. L'atmosphère générale doit être raffinée et paisible, comme si l'on dégustait du thé et discutait de la philosophie dans un bureau.
Au cours de l'exécution, il a démontré sa capacité à comprendre les symboles culturels.
En plus de réaliser le style visuel de base, il fera également des efforts dans les détails, comme l'ajout d'une animation de transition de rendu d'encre pour la commutation de page, l'ajout d'étiquettes de style de sceau sur les cartes de cours, et même le déclenchement d'une animation de tracé d'écriture au pinceau lorsque la souris est survolée.
Ces petites attentions rendent toute la page spirituelle, au lieu d'un simple empilement de code froid.
Le résultat est que j'ai envoyé cette démo à un ami qui travaille dans la communication culturelle, et sa première réaction a été de me demander quelle agence de design j'avais engagée.
Quand je lui ai dit que c'était fait par l'IA, elle n'y a absolument pas cru.
C'est pourquoi je dis que la vitesse d'évolution de l'IA au niveau esthétique pourrait être sous-estimée. Il ne s'agit pas seulement d'imiter le design humain, mais de vraiment comprendre la connotation culturelle et l'expression émotionnelle.

Conclusion
Après avoir testé ces quelques cas, je pense que la capacité de MiniMax M2.5 au niveau de l'exécution est vraiment assez forte.
Il peut comprendre des demandes complexes, planifier lui-même les étapes de la tâche, et la vitesse est incroyablement rapide. Les officiels disent que la vitesse d'inférence est 3 fois supérieure à celle d'Opus, et je pense que c'est le cas après l'avoir testé.
Si vous êtes également souvent freiné par des tâches triviales au niveau de l'exécution, je vous recommande vivement de le tester vous-même. L'interface API est maintenant ouverte, et la clé est de voir si elle peut vraiment s'intégrer à votre flux de travail.
Pour être honnête, au stade actuel du développement de l'IA, il ne s'agit plus de savoir si elle peut être utilisée, mais de savoir comment l'utiliser.Commencez tôt, profitez-en tôt.





