След тестването на MiniMax M2.5, започнах да се чудя дали да подновя Claude...
MiniMax M2.5 е тук! Веднага се свързах с Claude Code, за да го тествам.
Този път е наистина различно, официалните резултати, обявени от MiniMax, са доста взривоопасни.
SWE-Bench Verified получи 80.2%, Multi-SWE-Bench многоезичното програмиране е директно на първо място, а възможностите за търсене на BrowseComp също са на SOTA ниво от 76.3%.
Основателят на OpenClaw, Peter Steinberger, многократно е препоръчвал моделите от серията MiniMax в интервюта преди това, а този път, когато излезе M2.5, той директно препрати публикация:
„MiniMax току-що пусна MiniMaxM2.5, чиято производителност е сравнима с Opus4.6, а цената е 20 пъти по-ниска!“
Наистина силно препоръчвам на всички да опитат сами, M2.5 е напълно божествен за разработчиците, с много силни възможности за разработка!
След като започнах да използвам M2.5, започнах да се чудя дали е необходимо да подновя Claude следващия месец...

Основни предимства
Естетиката и завършеността на M2.5 са много високи, особено добър е в обработката на някои много сложни нужди за разработка. След малко можете да видите моя втори пример, завършен е много добре, тогава му отне само около 20 минути.
Официално MiniMax M2.5 се нарича архитектура, родена за интелигентни агенти, с други думи, този модел е роден да работи.
Неговите активирани параметри са само 10B, за сравнение, водещи модели като Claude Opus 4 имат стотици B параметри. Но M2.5 може да се конкурира с водещите флагмани в програмирането, обработката на документи и изпълнението на сложни задачи.
Точно напоследък забелязах, че много приятели около мен търсят външни изпълнители, за да правят проекти за разработка на уебсайтове или комерсиални платформи, и трябва да плащат пари.
Но трябва да кажа, че MiniMax M2.5 може да свърши цялата тази работа и ефектът изобщо не е по-лош от много онлайн платформи...
Изпълних 3 тестови сценария, обхващащи разработка на личен уебсайт, изграждане на търговска платформа и изграждане на онлайн образователна платформа, нека да видим какъв е практическият ефект на MiniMax M2.5 👇
Практически примери
Case 1: Блогър по красота иска да направи уебсайт за лична марка
Преди известно време приятел, който прави медии за красота, се консултира с мен, казвайки, че иска да използва AI, за да изгради личен уебсайт, за да покаже някои от своите произведения в социалните медии, за да улесни гледането от страна на A.
Но тя изобщо не разбира код и външните оферти за аутсорсинг започват от няколко хиляди.
Въз основа на тази нужда исках да опитам дали мога да използвам MiniMax M2.5 директно, за да направя всичко наведнъж.
Първо планира цялата технологична структура и структура на директориите на уебсайта, а след това започна да генерира код за всяка страница.
На някои места той ще оптимизира активно, като например автоматично регулиране на броя на колоните на водопада на мобилни устройства и добавяне на плавни преходни анимации към градиентния фон.
Целият процес отне само повече от три минути, генерирайки пълен HTML, CSS и код за адаптивно оформление.
От това се вижда, че практическата стойност е наистина очевидна, особено за лични блогъри, малки студия и други групи с ограничен бюджет, тази възможност директно намалява разходите за изграждане на уебсайт от десетки хиляди на нула.
Трябва само да представите нуждите си, а цялата останала техническа работа се оставя на AI.
Case 2: Сложни системи на платформа за търговско сътрудничество на KOL
Този случай е с една степен по-труден, исках да тествам дали може да обработва платформирани продукти с реална бизнес логика, а не просто да прави уебсайт за показване. Искам да създам платформа за бизнес сътрудничество с KOL (Key Opinion Leader - лидер на мнение), която да има табло за данни за инфлуенсъри, показващо профилите на феновете и цените, интелигентна система за съвпадение, която позволява на марките да въвеждат изисквания и AI да препоръчва подходящи KOL, визуален календар за графици, показващ графиците за следващите три месеца, както и библиотека с шаблони на договори и отчети за проследяване на данни.
Визуалният стил трябва да е като оформление на карти на Instagram, комбинирано с табло за управление на B2B SaaS.
Той се справя с това по-систематично от първия случай.
Първо, той разглобява функционалните модули и проектира подсистеми за табло за данни, алгоритъм за съвпадение, календарни компоненти и управление на документи.
След това ги свързва с оформление на поток от карти в предния край, а логиката на задния край се изпълнява с помощта на симулирани данни.
Интересното е, че когато прави функция за интелигентно съвпадение, той активно проектира опростена версия на алгоритъм за препоръки. Въпреки че не е истински модел за машинно обучение, логиката, базирана на съвпадение на етикети, вече може да покаже основните концепции.
Целият проект отне около 20 минути за разработка. Ако се наеме екип за разработка за такава сложност, ще отнеме почти месец-два.
И трябва да кажа, че тази способност е изключително ценна за предприемачите.
Ако имате бизнес идея и искате бързо да направите MVP (Minimum Viable Product - минимално жизнеспособен продукт), за да валидирате пазара, можете напълно да използвате този метод, за да създадете прототип на продукта и след това да решите дали да инвестирате ресурси за официална разработка.

Case 3: Онлайн образователна платформа за новокитайска естетика
В третия случай искам да тествам представянето му в областта на културното творчество. Този тип изисквания не са само за реализиране на функции, но и включват естетика и създаване на атмосфера, което често е слабост на AI.
Искам да направя уебсайт за онлайн образователната платформа за национални изследвания Shiguang Academy, който да има новокитайска естетика. Цветовете трябва да бъдат бежово, мастилено и цинобърно червено с градиент, а фонът да съдържа калиграфски произведения или пейзажи с мастило и вода, с ефект на разпръснати частици. Интегрирайте елементи от древни книги като бамбукови свитъци и печати, а текстът трябва да бъде подреден вертикално в шрифт Song. Всяка кутия за показване на курс трябва да прилича на книга с нишки, а фонът трябва да възпроизвежда видеоклипове с цитра или чаена церемония. Цялостната атмосфера трябва да е елегантна и спокойна, като да пиете чай и да обсъждате пътищата в кабинет.
По време на изпълнението той показа разбиране на културните символи.
В допълнение към реализирането на основния визуален стил, той също така ще работи върху детайлите, като например добавяне на преходна анимация с размазване на мастило към превключването на страници, добавяне на етикети в стил печат към картите на курса и дори задействане на анимация на път за писане с четка при задържане на мишката.
Тези малки мисли правят цялата страница духовна, а не студена купчина код.
В резултат на това изпратих това демо на приятел, който се занимава с културна комуникация, и първата му реакция беше да ме попита коя дизайнерска компания съм наел.
Когато му казах, че е направено от AI, той изобщо не повярва.
Затова казвам, че скоростта на еволюция на AI в естетически план може да бъде подценена. Той не просто имитира човешки дизайн, а наистина разбира културното значение и емоционалното изразяване.

Заключение
След като тествах тези няколко случая, чувствам, че възможностите на MiniMax M2.5 на ниво изпълнение са наистина достатъчно силни.
Той може да разбере сложни изисквания, може сам да планира стъпките на задачата и е невероятно бърз. Официално се казва, че скоростта на разсъждение е 3 пъти по-висока от тази на Opus, и след като го тествах, наистина имам това усещане.
Ако също често сте възпрепятствани от тривиални неща на ниво изпълнение, силно ви препоръчвам да го тествате лично. Сега API интерфейсът също е отворен. Важното е да видите дали може наистина да се интегрира във вашия работен процес.
Честно казано, на този етап от развитието на AI въпросът вече не е дали може да се използва, а дали знаете как да го използвате.Започнете по-рано, ще се възползвате по-рано.





