Nach dem Test von MiniMax M2.5 frage ich mich, ob ich Claude überhaupt noch verlängern soll...

2/15/2026
6 min read

MiniMax M2.5 ist da! Ich habe es sofort an Claude Code angeschlossen und getestet.

Diesmal ist es wirklich anders, die von MiniMax offiziell veröffentlichten Ergebnisse sind ziemlich beeindruckend.

SWE-Bench Verified erreichte 80,2 %, Multi-SWE-Bench mehrsprachige Programmierung ist direkt auf Platz 1, und die BrowseComp-Suchfähigkeit liegt mit 76,3 % ebenfalls auf SOTA-Niveau.

OpenClaw-Gründer Peter Steinberger hatte MiniMax-Modelle bereits in Interviews mehrfach empfohlen. Nach der Veröffentlichung von M2.5 hat er direkt einen Beitrag weitergeleitet:

"MiniMax hat gerade MiniMaxM2.5 veröffentlicht, dessen Leistung mit Opus4.6 vergleichbar ist, aber 20-mal günstiger!"

Ich möchte euch wirklich dringend empfehlen, es selbst auszuprobieren. M2.5 ist absolut ein Geschenk des Himmels für Entwickler, die Entwicklungsfähigkeiten sind extrem stark!

Nachdem ich M2.5 verwendet habe, frage ich mich, ob es überhaupt noch notwendig ist, Claude nächsten Monat zu verlängern...

Kernvorteile

Die Ästhetik und der Reifegrad von M2.5 sind sehr hoch, insbesondere bei der Bearbeitung sehr komplexer Entwicklungsanforderungen. Ihr könnt euch gleich meinen zweiten Fall ansehen, der sehr gut abgeschlossen wurde. Damals hat er wahrscheinlich nur 20 Minuten gedauert.

Offiziell wird MiniMax M2.5 als intelligente native Architektur bezeichnet. Mit anderen Worten, dieses Modell ist von Natur aus dazu bestimmt, zu arbeiten.

Seine Aktivierungsparameter betragen nur 10B. Im Vergleich dazu haben Flaggschiffmodelle wie Claude Opus 4 oft Hunderte von B Parametern. Aber M2.5 kann in den Bereichen Programmierung, Dokumentenverarbeitung und Ausführung komplexer Aufgaben mit den Top-Flaggschiffen mithalten.

Ich habe in letzter Zeit beobachtet, dass viele Freunde von mir Projekte zur Website-Entwicklung oder kommerzielle Plattformen erstellen und dafür Geld für Outsourcing ausgeben müssen.

Aber ich muss sagen, dass MiniMax M2.5 all diese Aufgaben erledigen kann, und der Effekt ist vielen Online-Plattformen in nichts nachsteht...

Ich habe 3 Testszenarien durchgespielt, die die Bereiche persönliche Website-Entwicklung, Aufbau kommerzieller Plattformen und Aufbau von Online-Bildungsplattformen abdecken. Schauen wir uns an, wie die praktische Wirkung von MiniMax M2.5 ist👇

Praktische Beispiele

Fall 1: Beauty-Blogger möchte eine persönliche Markenwebsite erstellen

Vor einiger Zeit hat mich ein Freund kontaktiert, der als Beauty-Influencer arbeitet, und gesagt, er möchte mit KI eine persönliche Website erstellen, um einige seiner Social-Media-Arbeiten zu präsentieren, damit Auftraggeber sie sehen können.

Aber er versteht überhaupt keinen Code, und die Angebote für Outsourcing beginnen bei mehreren Tausend.

Basierend auf dieser Anforderung wollte ich testen, ob ich MiniMax M2.5 direkt in einem Schritt verwenden kann.

Zuerst plante es den gesamten technischen Stack und die Verzeichnisstruktur der Website und begann dann, Seite für Seite Code zu generieren.

An einigen Stellen optimiert es aktiv, z. B. durch automatisches Anpassen der Anzahl der Spalten im Wasserfalllayout auf mobilen Geräten und Hinzufügen einer sanften Übergangsanimation zum Farbverlaufshintergrund.

Der gesamte Vorgang dauerte nur etwas mehr als drei Minuten und generierte vollständigen HTML-, CSS- und responsiven Layout-Code.

Daraus wird der praktische Wert deutlich, insbesondere für Einzelblogger und kleine Studios mit begrenztem Budget. Diese Fähigkeit reduziert die Kosten für die Website-Erstellung direkt von Zehntausenden auf Null.

Du musst nur die Anforderungen stellen, die restliche technische Arbeit wird von der KI erledigt.

Fall 2: Komplexes System einer KOL-Handelsplattform

Dieser Fall ist eine Stufe schwieriger. Ich möchte testen, ob er wirklich geschäftslogische Plattformprodukte verarbeiten kann, nicht nur eine Präsentationswebsite erstellen.Ich habe darum gebeten, eine KOL-Business-Kooperationsplattform zu erstellen, die ein Dashboard mit Daten zu Influencern, einschließlich Fan-Profilen und Preisangeboten, sowie ein intelligentes Matching-System bietet, das Marken nach Eingabe ihrer Anforderungen passende KOLs (Key Opinion Leader) durch KI empfiehlt. Ein visueller Terminkalender soll die Planung für die nächsten drei Monate anzeigen, und es soll eine Bibliothek mit Vertragsvorlagen und Datentracking-Berichten geben.

Der visuelle Stil sollte an das Kartenlayout von Instagram in Kombination mit dem Dashboard-Stil von B2B SaaS erinnern.

Die Herangehensweise ist systematischer als beim ersten Fall.

Zuerst wurden die Funktionsmodule zerlegt und die Subsysteme Daten-Dashboard, Matching-Algorithmus, Kalenderkomponente und Dokumentenverwaltung entworfen.

Anschließend wurden sie im Frontend mit einem Karten-Flow-Layout verbunden, und die Backend-Logik wurde mit simulierten Daten durchgespielt.

Interessant ist, dass bei der Erstellung der intelligenten Matching-Funktion proaktiv eine vereinfachte Version des Empfehlungsalgorithmus entworfen wurde. Obwohl es sich nicht um ein echtes Machine-Learning-Modell handelt, kann die auf Tag-Matching basierende Logik bereits das Kernkonzept demonstrieren.

Das gesamte Projekt dauerte etwa 20 Minuten. Bei dieser Komplexität würde es fast ein bis zwei Monate dauern, ein Entwicklungsteam damit zu beauftragen.

Und ich muss sagen, dass diese Fähigkeit für Unternehmer von enormem Wert ist.

Wenn Sie eine Geschäftsidee haben und schnell ein MVP (Minimum Viable Product) erstellen möchten, um den Markt zu validieren, können Sie auf diese Weise zuerst einen Produktprototyp erstellen und dann entscheiden, ob Sie Ressourcen in die formelle Entwicklung investieren möchten.

Fall 3: Online-Bildungsplattform für chinesische Ästhetik im neuen Stil

Im dritten Fall wollte ich seine Leistung im Bereich der kulturellen Kreativität testen. Diese Art von Anforderung umfasst nicht nur die Implementierung von Funktionen, sondern auch Ästhetik und die Schaffung einer Atmosphäre, was oft eine Schwäche von KI ist.

Ich habe darum gebeten, eine Website für die Online-Guoxue-Bildungsplattform Shiguang Shuyuan zu erstellen, die eine neue chinesische Ästhetik aufweist. Die Farben sollten cremeweiß, tintenschwarz und Zinnoberrot mit Farbverläufen sein, der Hintergrund sollte Kalligraphie oder Tuschemalerei zeigen und einen Partikelstreueffekt hinzufügen. Elemente wie Bambusrollen und Siegel aus alten Büchern sollten integriert werden, und der Text sollte in vertikaler Anordnung in der Schriftart Song gesetzt werden. Jeder Kursanzeigebereich sollte wie ein fadengeheftetes Buch aussehen, und im Hintergrund sollten Videos von Guqin-Musik oder Teezeremonien abgespielt werden. Die Gesamtatmosphäre sollte kultiviert und ruhig sein, wie das Gefühl, in einem Arbeitszimmer Tee zu trinken und zu diskutieren.

Während der Ausführung zeigte es ein Verständnis für kulturelle Symbole.

Neben der Umsetzung des grundlegenden visuellen Stils wurden auch Details hinzugefügt, z. B. eine Übergangsanimation mit Tuscheeffekt für Seitenwechsel, Etiketten im Siegelstil auf Kurskarten und sogar eine Pfadanimation, die beim Bewegen der Maus über das Element das Schreiben mit einem Pinsel simuliert.

Diese kleinen Details verliehen der gesamten Seite Lebendigkeit und machten sie zu mehr als nur einer kalten Ansammlung von Code.

Das Ergebnis war, dass ich diese Demo an Freunde geschickt habe, die im Bereich der Kulturkommunikation tätig sind, und ihre erste Reaktion war die Frage, welche Designfirma ich beauftragt hatte.

Als ich ihr sagte, dass dies von KI gemacht wurde, glaubte sie es überhaupt nicht.

Daher sage ich, dass die Evolutionsgeschwindigkeit von KI in Bezug auf Ästhetik möglicherweise unterschätzt wird. Sie imitiert nicht nur menschliches Design, sondern versteht wirklich kulturelle Konnotationen und emotionalen Ausdruck.

Zusammenfassung

Nachdem ich diese Fälle getestet habe, habe ich das Gefühl, dass die Fähigkeiten von MiniMax M2.5 auf der Ausführungsebene wirklich stark sind.

Es kann komplexe Anforderungen verstehen, Aufgaben selbstständig planen und ist unglaublich schnell. Der Hersteller sagt, dass die Inferenzgeschwindigkeit dreimal so hoch ist wie bei Opus, und meine Tests bestätigen dieses Gefühl.

Wenn Sie auch oft durch triviale Aufgaben auf der Ausführungsebene behindert werden, empfehle ich Ihnen dringend, es selbst zu testen. Die API-Schnittstelle ist jetzt ebenfalls geöffnet. Entscheidend ist, ob sie wirklich in Ihren Workflow integriert werden kann.

Ehrlich gesagt, in dieser Phase der KI-Entwicklung geht es nicht mehr darum, ob sie verwendet werden kann, sondern darum, wie sie verwendet wird.Früh anfangen, früh profitieren.

Published in Technology

You Might Also Like