Δοκίμασα το MiniMax M2.5 και άρχισα να αναρωτιέμαι αν πρέπει να ανανεώσω τη συνδρομή μου στο Claude...
Κυκλοφόρησε το MiniMax M2.5! Το συνέδεσα αμέσως με το Claude Code για να το δοκιμάσω.
Αυτή τη φορά είναι πραγματικά διαφορετικό, οι επιδόσεις που ανακοίνωσε επίσημα η MiniMax είναι εντυπωσιακές.
Το SWE-Bench Verified έλαβε 80,2%, το Multi-SWE-Bench στην πολυγλωσσική κωδικοποίηση είναι απευθείας πρώτο και η ικανότητα αναζήτησης BrowseComp είναι επίσης σε επίπεδο SOTA με 76,3%.
Ο ιδρυτής της OpenClaw, Peter Steinberger, είχε προτείνει επανειλημμένα τη σειρά μοντέλων MiniMax σε συνεντεύξεις του. Αυτή τη φορά, όταν κυκλοφόρησε το M2.5, προώθησε απευθείας μια ανάρτηση:
«Η MiniMax μόλις κυκλοφόρησε το MiniMaxM2.5, η απόδοσή του είναι ισοδύναμη με το Opus4.6 και η τιμή είναι 20 φορές φθηνότερη!»
Πρέπει πραγματικά να σας προτείνω να το δοκιμάσετε μόνοι σας, το M2.5 είναι απολύτως θεός για τους προγραμματιστές, με πολύ ισχυρές δυνατότητες ανάπτυξης!
Αφού άρχισα να χρησιμοποιώ το M2.5, άρχισα να αναρωτιέμαι αν υπάρχει λόγος να ανανεώσω τη συνδρομή μου στο Claude τον επόμενο μήνα...

Βασικά πλεονεκτήματα
Η αισθητική και η πληρότητα του M2.5 είναι πολύ υψηλές, ειδικά είναι εξαιρετικά ικανό να χειρίζεται πολύ περίπλοκες απαιτήσεις ανάπτυξης. Σε λίγο μπορείτε να δείτε το δεύτερο παράδειγμά μου, ολοκληρώθηκε πολύ καλά, του πήρε περίπου 20 λεπτά.
Οι επίσημοι αποκαλούν το MiniMax M2.5 μια εγγενή αρχιτεκτονική έξυπνου πράκτορα. Με άλλα λόγια, αυτό το μοντέλο είναι εκ φύσεως φτιαγμένο για να δουλεύει.
Έχει μόνο 10B ενεργοποιημένες παραμέτρους. Συγκριτικά, τα κορυφαία μοντέλα όπως το Claude Opus 4 έχουν εκατοντάδες B παραμέτρους. Αλλά το M2.5 μπορεί να ανταγωνιστεί τα κορυφαία μοντέλα σε τομείς όπως ο προγραμματισμός, η επεξεργασία εγγράφων και η εκτέλεση σύνθετων εργασιών.
Παρατήρησα πρόσφατα ότι πολλοί φίλοι μου κάνουν έργα ανάπτυξης ιστοσελίδων ή εμπορικές πλατφόρμες και πρέπει να πληρώσουν για εξωτερική ανάθεση.
Αλλά πρέπει να πω ότι το MiniMax M2.5 μπορεί να κάνει όλες αυτές τις δουλειές και το αποτέλεσμα δεν είναι καθόλου χειρότερο από πολλές διαδικτυακές πλατφόρμες...
Έτρεξα 3 σενάρια δοκιμών, που καλύπτουν την ανάπτυξη προσωπικών ιστοσελίδων, τη δημιουργία εμπορικών πλατφορμών και τη δημιουργία διαδικτυακών εκπαιδευτικών πλατφορμών. Ας δούμε πώς αποδίδει το MiniMax M2.5 στην πράξη 👇
Πρακτικά παραδείγματα
Case 1: Μια blogger ομορφιάς θέλει να δημιουργήσει μια προσωπική ιστοσελίδα επωνυμίας
Πριν από λίγο καιρό, ένας φίλος μου που ασχολείται με τα μέσα κοινωνικής δικτύωσης για την ομορφιά με συμβουλεύτηκε, λέγοντας ότι ήθελε να χρησιμοποιήσει την τεχνητή νοημοσύνη για να δημιουργήσει μια προσωπική ιστοσελίδα για να παρουσιάσει μερικές από τις δουλειές της στα μέσα κοινωνικής δικτύωσης, ώστε να είναι πιο εύκολο να τις δείξει στους πελάτες.
Αλλά δεν καταλαβαίνει καθόλου από κώδικα και οι προσφορές για εξωτερική ανάθεση ξεκινούν από χιλιάδες.
Με βάση αυτή την ανάγκη, ήθελα να δοκιμάσω αν μπορούσα να χρησιμοποιήσω απευθείας το MiniMax M2.5 για να το κάνω με μία κίνηση.
Πρώτα σχεδίασε τη στοίβα τεχνολογίας και τη δομή καταλόγου ολόκληρης της ιστοσελίδας και μετά άρχισε να δημιουργεί κώδικα για κάθε σελίδα.
Σε ορισμένα σημεία θα βελτιστοποιήσει ενεργά, όπως η αυτόματη προσαρμογή του αριθμού των στηλών της διάταξης καταρράκτη σε κινητές συσκευές και η προσθήκη ομαλών μεταβάσεων κίνησης στο φόντο διαβάθμισης.
Η όλη διαδικασία διήρκεσε περίπου τρία λεπτά και δημιούργησε πλήρη κώδικα HTML, CSS και ανταποκρινόμενης διάταξης.
Επομένως, η πρακτική αξία είναι πραγματικά προφανής, ειδικά για προσωπικούς bloggers και μικρά στούντιο με περιορισμένο προϋπολογισμό, αυτή η δυνατότητα μειώνει άμεσα το κόστος δημιουργίας ιστοσελίδας από δεκάδες χιλιάδες σε μηδέν.
Απλά υποβάλετε τις απαιτήσεις και αφήστε όλες τις υπόλοιπες τεχνικές εργασίες στην τεχνητή νοημοσύνη.
Case 2: Σύμπλοκο σύστημα πλατφόρμας εμπορικής συνεργασίας KOL
Αυτή η περίπτωση είναι ένα σκαλοπάτι πιο δύσκολη. Αυτό που ήθελα να δοκιμάσω είναι αν μπορεί να χειριστεί ένα πραγματικό προϊόν πλατφόρμας με επιχειρηματική λογική, όχι απλώς να δημιουργήσει μια ιστοσελίδα επίδειξης.Θέλω να δημιουργήσω μια πλατφόρμα επιχειρηματικής συνεργασίας KOL, με έναν πίνακα δεδομένων influencer που να εμφανίζει το προφίλ των θαυμαστών και τις προσφορές, ένα έξυπνο σύστημα αντιστοίχισης που επιτρέπει στις μάρκες να εισάγουν απαιτήσεις και η AI να προτείνει κατάλληλους KOL, ένα οπτικοποιημένο ημερολόγιο διαθεσιμότητας που να εμφανίζει το πρόγραμμα των επόμενων τριών μηνών, καθώς και μια βιβλιοθήκη προτύπων συμβάσεων και μια αναφορά παρακολούθησης δεδομένων.
Το οπτικό στυλ θα πρέπει να μοιάζει με τη διάταξη καρτών του Instagram σε συνδυασμό με το στυλ πίνακα ελέγχου B2B SaaS.
Η επεξεργασία του είναι πιο συστηματική από την πρώτη περίπτωση.
Αρχικά, αποσυναρμολογούνται οι λειτουργικές ενότητες και σχεδιάζονται ξεχωριστά τα υποσυστήματα του πίνακα δεδομένων, του αλγορίθμου αντιστοίχισης, του στοιχείου ημερολογίου και της διαχείρισης εγγράφων.
Στη συνέχεια, συνδέονται στο frontend με μια διάταξη ροής καρτών και η λογική του backend εκτελείται σε ολόκληρη τη διαδικασία με προσομοιωμένα δεδομένα.
Είναι ενδιαφέρον ότι, κατά την εκτέλεση της έξυπνης λειτουργίας αντιστοίχισης, θα σχεδιάσει ενεργά μια απλοποιημένη έκδοση του αλγορίθμου σύστασης. Αν και δεν είναι ένα πραγματικό μοντέλο μηχανικής μάθησης, η λογική που βασίζεται στην αντιστοίχιση ετικετών μπορεί ήδη να δείξει την βασική ιδέα.
Ολόκληρο το έργο αναπτύχθηκε σε περίπου 20 λεπτά. Αυτό το επίπεδο πολυπλοκότητας θα χρειαζόταν σχεδόν ένα ή δύο μήνες για μια ομάδα ανάπτυξης.
Και πρέπει να πω ότι αυτή η ικανότητα είναι τεράστιας αξίας για τους επιχειρηματίες.
Έχετε μια επιχειρηματική ιδέα και θέλετε να δημιουργήσετε γρήγορα ένα MVP για να επαληθεύσετε την αγορά. Μπορείτε να χρησιμοποιήσετε αυτόν τον τρόπο για να δημιουργήσετε πρώτα το πρωτότυπο του προϊόντος και, στη συνέχεια, να αποφασίσετε αν θα επενδύσετε πόρους για να κάνετε επίσημη ανάπτυξη.

Case 3: Διαδικτυακή εκπαιδευτική πλατφόρμα Νέας Κινεζικής Αισθητικής
Στην τρίτη περίπτωση, θέλω να δοκιμάσω την απόδοσή του στην πολιτιστική και δημιουργική κατεύθυνση. Αυτές οι απαιτήσεις δεν αφορούν μόνο την υλοποίηση λειτουργιών, αλλά και την αισθητική και τη δημιουργία ατμόσφαιρας, που συχνά είναι οι αδυναμίες της AI.
Θέλω να δημιουργήσω έναν ιστότοπο για την διαδικτυακή πλατφόρμα εκπαίδευσης κλασικών κινεζικών σπουδών Shiguang Academy, με νέα κινεζική αισθητική. Τα χρώματα θα πρέπει να είναι μπεζ, μελάνι και βερμιγιόν με διαβαθμίσεις, το φόντο θα πρέπει να περιέχει καλλιγραφικά έργα ή τοπία με μελάνι και νερό και να προσθέτει ένα εφέ διασποράς σωματιδίων. Ενσωματώστε στοιχεία αρχαίων βιβλίων όπως μπαμπού και σφραγίδες και χρησιμοποιήστε κάθετη διάταξη γραμματοσειράς Song. Κάθε πλαίσιο εμφάνισης μαθήματος θα πρέπει να μοιάζει με ένα βιβλίο με ραμμένο νήμα και το φόντο θα πρέπει να παίζει βίντεο αρχαίας άρπας ή τελετής τσαγιού. Η συνολική ατμόσφαιρα θα πρέπει να είναι εκλεπτυσμένη και ήρεμη, σαν να δοκιμάζετε τσάι και να συζητάτε φιλοσοφία σε μια μελέτη.
Κατά τη διάρκεια της εκτέλεσης, έδειξε την ικανότητά του να κατανοεί πολιτιστικά σύμβολα.
Εκτός από την υλοποίηση του βασικού οπτικού στυλ, θα κάνει επίσης αλλαγές στις λεπτομέρειες, όπως η προσθήκη μιας μεταβατικής κινούμενης εικόνας με μελάνι και νερό στις αλλαγές σελίδας, η προσθήκη ετικετών σε στυλ σφραγίδας στις κάρτες μαθημάτων και ακόμη και η ενεργοποίηση μιας κινούμενης εικόνας διαδρομής γραφής με πινέλο όταν ο δείκτης του ποντικιού αιωρείται.
Αυτές οι μικρές σκέψεις έδωσαν πνεύμα σε ολόκληρη τη σελίδα και δεν ήταν πλέον μια ψυχρή στοίβα κώδικα.
Το αποτέλεσμα ήταν ότι έστειλα αυτό το demo σε έναν φίλο που ασχολείται με την πολιτιστική διάδοση και η πρώτη του αντίδραση ήταν να με ρωτήσει ποια εταιρεία σχεδιασμού βρήκα.
Όταν του είπα ότι το έκανε η AI, δεν το πίστεψε καθόλου.
Έτσι λέω ότι η ταχύτητα εξέλιξης της AI στο αισθητικό επίπεδο μπορεί να υποτιμάται. Δεν μιμείται απλώς τον ανθρώπινο σχεδιασμό, αλλά κατανοεί πραγματικά την πολιτιστική σημασία και τη συναισθηματική έκφραση.

Συμπέρασμα
Αφού δοκίμασα αυτές τις περιπτώσεις, αισθάνομαι ότι οι δυνατότητες του MiniMax M2.5 στο επίπεδο εκτέλεσης είναι πράγματι αρκετά ισχυρές.
Μπορεί να κατανοήσει σύνθετες απαιτήσεις, να σχεδιάσει μόνος του τα βήματα της εργασίας και είναι εξαιρετικά γρήγορο. Οι επίσημοι λένε ότι η ταχύτητα συμπερασμού είναι 3 φορές μεγαλύτερη από αυτή του Opus και αισθάνομαι ότι είναι αλήθεια.
Εάν επίσης συχνά καθυστερείτε από ασήμαντες εργασίες στο επίπεδο εκτέλεσης, συνιστώ ανεπιφύλακτα να το δοκιμάσετε μόνοι σας. Η διεπαφή API είναι επίσης ανοιχτή τώρα. Το κλειδί είναι να δείτε αν μπορεί πραγματικά να ενσωματωθεί στη ροή εργασίας σας.
Ειλικρινά, η ανάπτυξη της AI έχει φτάσει σε αυτό το στάδιο και δεν είναι πλέον θέμα αν μπορεί να χρησιμοποιηθεί, αλλά αν ξέρετε πώς να τη χρησιμοποιήσετε.Ξεκινήστε νωρίς, επωφεληθείτε νωρίτερα.





