稀宇 MiniMax M2.5 Apskats

2/14/2026
2 min read

稀宇 MiniMax M2.5 Apskats\n\nĪss secinājums: Iesakņojas dziļi, aug augšup\n\n## Pamatinformācija\n\n稀宇 iepriekšējā paaudze M2.1 tehnisku problēmu dēļ, lai gan programmēšanas jomā bija ievērojams progress, loģiskā domāšana atpalika no M2. Par laimi, M2.5 būtībā atrisināja tehniskās problēmas, un spējas atgriezās normālā līmenī. Salīdzinot ar M2, M2.5 progress ir aptuveni 17%.\n\nTomēr daļa progresa tika panākta ar garāku domāšanas ķēdi un dziļāku risinājumu telpas izpēti. M2.5 vidējais Token patēriņš ir 6. augstākais starp visiem testētajiem modeļiem, gandrīz 2 reizes lielāks nekā konkurentam Sonnet. Par laimi, 稀宇 skaitļošanas jauda ir garantēta, un izmaksas nav augstas. Lai gan programmēšana nevar pilnībā aizstāt Sonnet, ikdienas lietošanai tā ir pilnībā pieejama. M2.5 beidzot sasniedza M2.1 izvirzīto mērķi.\n\n## Loģiskie rezultāti\n\nLoģisko rezultātu tabula\n\n1 Lai izceltu salīdzinājumu, tabulā ir parādīti tikai daži salīdzināmie modeļi, nevis pilns saraksts.\n\n2 Jautājumi un testēšanas metodes, skatiet: Lielo valodu modeļu - loģisko spēju horizontālais novērtējums 26-01 mēneša tops. Pievienots #56 jautājums.\n\n*3 Pilns saraksts tiek atjaunināts vietnē https://llm2014.github.io/llm_benchmark/\n\n*4 Sarkanā krāsa ir ierobežota Ķīniešu Jaunā gada periodam, lai paustu prieku, un tai nav citas nozīmes.\n\nTā kā M2.1 ir versija ar kļūdām un neparasti zemu loģisko domāšanu, turpmāk tekstā tiks veikts tikai M2 un M2.5 paaudžu salīdzinājums.\n\n## Uzlabojumi\n\n- Stabila spriešana: M2.5 var saglabāt sākotnējos ierobežojumus un konteksta detaļas garākā spriešanas procesā, tāpēc dažos ne pārāk sarežģītos, bet

Published in Technology

You Might Also Like