MiniMax M2.5-ыг туршиж үзсэний дараа би Claude-ийг сунгах хэрэгтэй юу гэж эргэлзэж эхэллээ...
MiniMax M2.5 гарлаа! Би Claude Code-д шууд холбогдож туршиж үзсэн.
Энэ удаа үнэхээр өөр байна, MiniMax-ийн албан ёсны зарласан амжилтын үзүүлэлтүүд үнэхээр гайхалтай.
SWE-Bench Verified 80.2%-ийг авсан, Multi-SWE-Bench олон хэлний програмчлалаар шууд тэргүүлсэн, BrowseComp хайлтын чадвар нь ч мөн 76.3%-ийн SOTA түвшинд хүрсэн.
OpenClaw-ийн үүсгэн байгуулагч Peter Steinberger өмнө нь ярилцлагадаа MiniMax цуврал загваруудыг хэд хэдэн удаа санал болгож байсан бөгөөд энэ удаа M2.5 гарсны дараа тэр шууд нэг нийтлэлийг хуваалцсан:
"MiniMax дөнгөж сая MiniMaxM2.5-ыг гаргалаа, түүний үзүүлэлт нь Opus4.6-тай адилхан, үнэ нь 20 дахин хямд!"
Би та бүхэнд өөрсдөө туршиж үзэхийг үнэхээр зөвлөж байна, M2.5 бол хөгжүүлэгчдийн бурхан, хөгжүүлэх чадвар нь маш хүчтэй!
Би M2.5-ыг ашиглаж эхэлснээс хойш дараа сард Claude-ийг сунгах шаардлагатай юу гэж эргэлзэж эхэлсэн...

Гол давуу талууд
M2.5-ын гоо зүй болон гүйцэтгэл маш өндөр, ялангуяа маш төвөгтэй хөгжүүлэлтийн хэрэгцээг шийдвэрлэхэд сайн. Та бүхэн миний 2 дахь жишээг хараарай, маш сайн гүйцэтгэсэн, тэр үед ердөө 20 минут зарцуулсан.
Албан ёсоор MiniMax M2.5-ыг ухаалаг биетэд зориулсан үндсэн архитектур гэж нэрлэдэг, өөрөөр хэлбэл энэ загвар нь төрөлхийн ажил хийх хувь тавилантай.
Түүний идэвхжүүлсэн параметрийн хэмжээ нь ердөө 10B, харьцуулбал Claude Opus 4 гэх мэт тэргүүлэх загварууд хэдэн зуун B параметр агуулдаг. Гэхдээ M2.5 нь програмчлал, баримт бичиг боловсруулах, төвөгтэй даалгавар гүйцэтгэх зэрэг чиглэлээр дээд зэрэглэлийн тэргүүлэх загваруудтай өрсөлдөх чадвартай.
Саяхан би эргэн тойрны олон найзууд вэбсайт хөгжүүлэх төсөл хийж байгааг анзаарсан, эсвэл арилжааны платформ байгуулахдаа гадны тусламж авахад мөнгө төлөх шаардлагатай болдог.
Гэхдээ би MiniMax M2.5 эдгээр ажлыг хийж чадна гэж хэлэх ёстой, мөн үр дүн нь олон онлайн платформоос дутахгүй...
Би хувийн вэбсайт хөгжүүлэх, арилжааны платформ байгуулах, онлайн боловсролын платформ байгуулах гэсэн чиглэлээр 3 туршилтын хувилбар ажиллуулсан, MiniMax M2.5-ын бодит байдал дээрх үр дүнг харцгаая👇
Бодит байдлын жишээ
Case 1: Гоо сайхны блоггер хувийн брэндийн вэбсайт хийх гэж байна
Саяхан гоо сайхны өөрөө мэдээллийн хэрэгсэл эрхлэгч найз надаас зөвлөгөө авахаар ирсэн, тэр өөрийнхөө нийгмийн сүлжээний бүтээлүүдийг харуулах, А талд үзүүлэхэд хялбар байлгах зорилгоор хиймэл оюун ухаанаар хувийн вэбсайт байгуулахыг хүсч байна гэсэн.
Гэхдээ тэр өөрөө кодын талаар огт мэдлэггүй, гаднаас тусламж авахад хэдэн мянган юаниас эхэлдэг.
Энэ хэрэгцээнд үндэслэн би MiniMax M2.5-ыг шууд нэг алхамаар ашиглаж болох эсэхийг туршиж үзэхийг хүссэн.
Эхлээд тэр бүх вэбсайтын технологийн стек болон директорын бүтцийг төлөвлөж, дараа нь хуудас бүрийн кодыг үе шаттайгаар үүсгэж эхэлсэн.
Зарим газруудад тэр идэвхтэйгээр оновчтой болгодог, жишээлбэл хөдөлгөөнт төхөөрөмж дээр усан оргилуурын урсгалын баганын тоог автоматаар тохируулж, аажмаар өөрчлөгдөх дэвсгэр дээр жигд шилжилтийн хөдөлгөөн нэмсэн.
Бүх процесс нь гурван минут гаруй хугацаа зарцуулсан бөгөөд бүрэн HTML, CSS болон хариу үйлдэл үзүүлэх байршлын кодыг үүсгэсэн.
Үүнээс үзэхэд практик үнэ цэнэ нь үнэхээр тодорхой байна, ялангуяа хувийн блоггер, жижиг студи гэх мэт төсөв хязгаарлагдмал бүлгийн хувьд энэ чадвар нь вэбсайт байгуулах зардлыг хэдэн арван мянган юаниас тэг болгож бууруулдаг.
Та зөвхөн хэрэгцээгээ тавь, үлдсэн техникийн ажлыг бүгдийг нь хиймэл оюун ухаанд даатга.
Case 2: KOL арилжааны хамтын ажиллагааны платформын төвөгтэй систем
Энэ кейсийн нарийн төвөгтэй байдал нэг шат ахисан, би түүнийг жинхэнэ бизнесийн логиктой платформын төрлийн бүтээгдэхүүнийг шийдвэрлэж чадах эсэхийг туршиж үзэхийг хүссэн, зүгээр л үзэсгэлэнгийн вэбсайт хийхээс илүү. Би KOL-ын бизнесийн хамтын ажиллагааны платформ үүсгэхийг хүсэж байна. Үүнд олон нийтийн сүлжээний оддын мэдээллийн самбар, фэнүүдийн зураг болон үнийн санал, брэндийн талын хэрэгцээг оруулсны дараа тохирох KOL-ыг AI-аар санал болгох ухаалаг тохируулах систем, ирэх гурван сарын хуваарийг харуулах хугацааны хуанли, гэрээний загварын сан, мэдээлэл хянах тайлан байх ёстой.
Харааны хэв маяг нь Instagram-ын картын байршил дээр B2B SaaS-ийн хянах самбарын хэв маягтай байх ёстой.
Энэ нь эхний тохиолдлоос илүү системтэйгээр шийдвэрлэгддэг.
Эхлээд функцийн модулиудыг задлан шинжилж, мэдээллийн самбар, тохируулах алгоритм, хуанлийн бүрэлдэхүүн хэсэг, баримт бичгийн менежментийн дэд системийг тус тусад нь зохион бүтээсэн.
Дараа нь урд талд нь картын урсгалын байршлаар холбож, арын логикийг дуураймал өгөгдлөөр бүхэл процессыг гүйцээсэн.
Сонирхолтой нь, ухаалаг тохируулах функцийг хийхдээ хялбаршуулсан санал болгох алгоритмыг идэвхтэй зохион бүтээдэг. Энэ нь жинхэнэ машин сургалтын загвар биш ч шошго тохируулах логик дээр суурилсан гол ойлголтыг харуулж чадна.
Бүх төслийг ойролцоогоор 20 гаруй минутын дотор хөгжүүлсэн. Хэрэв хөгжүүлэгч багт хийлгэвэл энэ түвшний нарийн төвөгтэй байдлыг нэг, хоёр сарын дотор хийж дуусгах боломжгүй.
Түүнчлэн энэ чадвар нь гарааны бизнес эрхлэгчдэд асар их үнэ цэнийг өгдөг гэдгийг би хэлэх ёстой.
Танд бизнесийн санаа байгаа бөгөөд зах зээлийг шалгахын тулд MVP-г хурдан хийхийг хүсч байвал бүтээгдэхүүний загварыг эхлээд ийм байдлаар бүтээж, дараа нь албан ёсны хөгжүүлэлтэд нөөц оруулах эсэхээ шийдэж болно.

Case 3: Шинэ Хятад гоо зүйн онлайн боловсролын платформ
Гурав дахь тохиолдолд би үүнийг соёлын бүтээлч чиглэлд хэрхэн ажиллахыг туршиж үзэхийг хүсч байна. Энэ төрлийн хэрэгцээ нь зөвхөн функц хэрэгжүүлэхээс гадна гоо зүй, уур амьсгалыг бий болгохтой холбоотой бөгөөд энэ нь AI-ийн сул тал юм.
Би Шигуан номын сангийн онлайн үндэсний судлалын боловсролын платформыг вэбсайт болгохыг хүсч байна. Шинэ Хятад гоо зүйтэй байх ёстой. Өнгө нь цагаан, бэхэн болон улаан шаргал өнгөтэй, дэвсгэр дээр уран бичлэгийн бүтээл эсвэл усан будгийн уул, усны зураг тавьж, бөөмс тархсан эффект нэмнэ. Хуйлмал хулсан дэвтэр, тамга зэрэг эртний номын элементүүдийг нэгтгэж, текстийг Сонг үсгээр босоо байдлаар бичнэ. Хичээлийн үзүүлэнгийн хүрээ бүр оёмол ном шиг байх ёстой, дэвсгэр дээр эртний ятга эсвэл цайны урлагийн видео тоглуулна. Нийт уур амьсгал нь эрдэм шинжилгээний, тайван байх ёстой, номын санд цай ууж, сургаал номлол ярьж байгаа мэт сэтгэгдэл төрүүлэх ёстой.
Гүйцэтгэх явцад соёлын бэлгэдлийг ойлгох чадварыг харуулсан.
Үндсэн харааны хэв маягийг хэрэгжүүлэхээс гадна нарийн ширийн зүйлд анхаарч ажилладаг. Жишээлбэл, хуудас солихдоо усан будгийн бүдэгрэх шилжилтийн хөдөлгөөн нэмж, хичээлийн карт дээр тамганы хэв маягийн шошго нэмж, тэр ч байтугай хулганыг байрлуулахад багсаар бичсэн замын хөдөлгөөн үүсгэдэг.
Эдгээр жижиг санаанууд нь бүх хуудсыг сүнслэг болгож, хүйтэн код биш болгодог.
Үр дүнд нь би энэ демог соёлын тархалтыг хийдэг найздаа үзүүлэхэд түүний хамгийн эхний хариулт нь ямар дизайны компани олсон бэ гэж асуусан.
Би үүнийг AI хийсэн гэж хэлэхэд тэр огт итгэсэнгүй.
Тиймээс би AI-ийн гоо зүйн түвшинд хүрэх хурдыг дутуу үнэлж магадгүй гэж хэлсэн. Энэ нь зөвхөн хүний дизайныг дуурайж байгаа төдийгүй соёлын агуулга, сэтгэл хөдлөлийг үнэхээр ойлгож байна.

Дүгнэлт
Эдгээр хэд хэдэн тохиолдлыг туршиж үзсэний дараа MiniMax M2.5-ын гүйцэтгэх түвшний чадвар хангалттай хатуу гэж би бодож байна.
Энэ нь нарийн төвөгтэй хэрэгцээг ойлгож, ажлын алхмуудыг өөрөө төлөвлөж чаддаг бөгөөд хурд нь гайхалтай хурдан, албан ёсны хэлснээр таамаглах хурд нь Opus-аас 3 дахин хурдан, би туршиж үзэхэд үнэхээр тийм санагдсан.
Хэрэв та гүйцэтгэх түвшний жижиг асуудлуудад байнга саад болдог бол өөрөө туршиж үзэхийг зөвлөж байна. Одоо API интерфэйс нээлттэй болсон. Гол нь энэ нь таны ажлын урсгалд үнэхээр нэвтэрч чадах эсэх юм.
Үнэнийг хэлэхэд AI одоогийн байдлаар хөгжлийн энэ үе шатанд хүрч байгаа нь ашиглаж болох эсэх асуудал биш, харин хэрхэн ашиглах вэ гэдэг асуудал болж байна.Эрт эхэлж, эрт ашиг хүрт.





