稀宇 MiniMax M2.5 کا جائزہ
2/14/2026
2 min read
稀宇 MiniMax M2.5 کا جائزہ\n\nمختصر نتیجہ: نیچے جڑیں، اوپر بڑھیں\n\n## بنیادی صورتحال\n\n稀宇 کی پچھلی نسل M2.1 میں تکنیکی مسائل کی وجہ سے، اگرچہ پروگرامنگ کے لحاظ سے نمایاں پیش رفت ہوئی، لیکن منطقی صلاحیت M2 سے پیچھے رہ گئی۔ خوش قسمتی سے، M2.5 نے بنیادی طور پر تکنیکی مسائل کو حل کر لیا ہے اور صلاحیت معمول کی سطح پر واپس آ گئی ہے۔ M2 کے مقابلے میں، M2.5 میں تقریباً 17% بہتری آئی ہے۔\n\nتاہم، کچھ بہتری زیادہ طویل سوچ کے سلسلے اور حل کی جگہ کی گہری تلاش کے ذریعے حاصل کی گئی ہے۔ M2.5 کی اوسط ٹوکن کی کھپت زیرِ آزمائش تمام ماڈلز میں چھٹے نمبر پر ہے، جو حریف Sonnet سے تقریباً 2 گنا زیادہ ہے۔ خوش قسمتی سے، 稀宇 کی کمپیوٹنگ پاور کی ضمانت ہے اور لاگت بھی زیادہ نہیں ہے۔ اگرچہ پروگرامنگ Sonnet کا مکمل متبادل نہیں بن سکتی، لیکن روزمرہ کے استعمال کے لیے یہ مکمل طور پر قابل استعمال ہے۔ M2.5 نے بالآخر M2.1 کے مطلوبہ ہدف کو حاصل کر لیا ہے۔\n\n## منطقی نتائج\n\n
\n\n1 جدول میں موازنہ تعلق کو اجاگر کرنے کے لیے، صرف کچھ قابلِ موازنہ ماڈلز دکھائے گئے ہیں، یہ مکمل ترتیب نہیں ہے۔\n\n2 سوالات اور جانچ کے طریقے کے لیے ملاحظہ کریں: بڑے لسانی ماڈل - منطقی صلاحیت کا افقی جائزہ 26-01 ماہانہ فہرست۔ نیا #56 سوال۔\n\n3 مکمل فہرست https://llm2014.github.io/llm_benchmark/ پر اپ ڈیٹ کی جاتی ہے۔\n\n4 سرخ رنگ چینی نئے سال کی مدت کے لیے محدود ہے، جو خوشی کی علامت ہے، اس کا کوئی دوسرا مطلب نہیں ہے۔\n\nچونکہ M2.1 ایک بگ والا ورژن تھا، جس کی منطقی صلاحیت غیر معمولی طور پر کم تھی، اس لیے ذیل میں صرف M2 اور M2.5 کا بین النسلی موازنہ کیا جائے گا۔\n\n## بہتری\n\n- مستحکم استدلال: M2.5 ابتدائی رکاوٹوں اور سیاق و سباق کی تفصیلات کو طویل استدلال کے عمل میں برقرار رکھ سکتا ہے، اس لیے کچھ ایسے مسائل جو زیادہ مشکل نہیں ہیں، لیکن
Published in Technology





