稀宇 MiniMax M2.5 کا جائزہ

2/14/2026
2 min read

稀宇 MiniMax M2.5 کا جائزہ\n\nمختصر نتیجہ: نیچے جڑیں، اوپر بڑھیں\n\n## بنیادی صورتحال\n\n稀宇 کی پچھلی نسل M2.1 میں تکنیکی مسائل کی وجہ سے، اگرچہ پروگرامنگ کے لحاظ سے نمایاں پیش رفت ہوئی، لیکن منطقی صلاحیت M2 سے پیچھے رہ گئی۔ خوش قسمتی سے، M2.5 نے بنیادی طور پر تکنیکی مسائل کو حل کر لیا ہے اور صلاحیت معمول کی سطح پر واپس آ گئی ہے۔ M2 کے مقابلے میں، M2.5 میں تقریباً 17% بہتری آئی ہے۔\n\nتاہم، کچھ بہتری زیادہ طویل سوچ کے سلسلے اور حل کی جگہ کی گہری تلاش کے ذریعے حاصل کی گئی ہے۔ M2.5 کی اوسط ٹوکن کی کھپت زیرِ آزمائش تمام ماڈلز میں چھٹے نمبر پر ہے، جو حریف Sonnet سے تقریباً 2 گنا زیادہ ہے۔ خوش قسمتی سے، 稀宇 کی کمپیوٹنگ پاور کی ضمانت ہے اور لاگت بھی زیادہ نہیں ہے۔ اگرچہ پروگرامنگ Sonnet کا مکمل متبادل نہیں بن سکتی، لیکن روزمرہ کے استعمال کے لیے یہ مکمل طور پر قابل استعمال ہے۔ M2.5 نے بالآخر M2.1 کے مطلوبہ ہدف کو حاصل کر لیا ہے۔\n\n## منطقی نتائج\n\nمنطقی نتائج کا جدول\n\n1 جدول میں موازنہ تعلق کو اجاگر کرنے کے لیے، صرف کچھ قابلِ موازنہ ماڈلز دکھائے گئے ہیں، یہ مکمل ترتیب نہیں ہے۔\n\n2 سوالات اور جانچ کے طریقے کے لیے ملاحظہ کریں: بڑے لسانی ماڈل - منطقی صلاحیت کا افقی جائزہ 26-01 ماہانہ فہرست۔ نیا #56 سوال۔\n\n3 مکمل فہرست https://llm2014.github.io/llm_benchmark/ پر اپ ڈیٹ کی جاتی ہے۔\n\n4 سرخ رنگ چینی نئے سال کی مدت کے لیے محدود ہے، جو خوشی کی علامت ہے، اس کا کوئی دوسرا مطلب نہیں ہے۔\n\nچونکہ M2.1 ایک بگ والا ورژن تھا، جس کی منطقی صلاحیت غیر معمولی طور پر کم تھی، اس لیے ذیل میں صرف M2 اور M2.5 کا بین النسلی موازنہ کیا جائے گا۔\n\n## بہتری\n\n- مستحکم استدلال: M2.5 ابتدائی رکاوٹوں اور سیاق و سباق کی تفصیلات کو طویل استدلال کے عمل میں برقرار رکھ سکتا ہے، اس لیے کچھ ایسے مسائل جو زیادہ مشکل نہیں ہیں، لیکن

Published in Technology

You Might Also Like

کس طرح کلاؤڈ کمپیوٹنگ ٹیکنالوجی کا استعمال کریں: آپ کی پہلی کلاؤڈ بنیادی ڈھانچے کی مکمل رہنمائیTechnology

کس طرح کلاؤڈ کمپیوٹنگ ٹیکنالوجی کا استعمال کریں: آپ کی پہلی کلاؤڈ بنیادی ڈھانچے کی مکمل رہنمائی

کس طرح کلاؤڈ کمپیوٹنگ ٹیکنالوجی کا استعمال کریں: آپ کی پہلی کلاؤڈ بنیادی ڈھانچے کی مکمل رہنمائی تعارف ڈیجیٹل تبدیلی کی ر...

پیشگی خبر! Claude Code کے بانی کا کہنا ہے: ایک مہینے بعد Plan Mode کا استعمال نہ ہونے پر سافٹ ویئر انجینئر کا لقب غائب ہو جائے گاTechnology

پیشگی خبر! Claude Code کے بانی کا کہنا ہے: ایک مہینے بعد Plan Mode کا استعمال نہ ہونے پر سافٹ ویئر انجینئر کا لقب غائب ہو جائے گا

پیشگی خبر! Claude Code کے بانی کا کہنا ہے: ایک مہینے بعد Plan Mode کا استعمال نہ ہونے پر سافٹ ویئر انجینئر کا لقب غائب ہ...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026 سال کے ٹاپ 10 AI ایجنٹس: بنیادی خصوصیات کا تجزیہTechnology

2026 سال کے ٹاپ 10 AI ایجنٹس: بنیادی خصوصیات کا تجزیہ

2026 سال کے ٹاپ 10 AI ایجنٹس: بنیادی خصوصیات کا تجزیہ تعارف مصنوعی ذہانت کی تیز رفتار ترقی کے ساتھ، AI ایجنٹس (AI Agents...

2026 کے ٹاپ 10 AI ٹولز کی سفارش: مصنوعی ذہانت کی حقیقی صلاحیت کو آزاد کرناTechnology

2026 کے ٹاپ 10 AI ٹولز کی سفارش: مصنوعی ذہانت کی حقیقی صلاحیت کو آزاد کرنا

2026 کے ٹاپ 10 AI ٹولز کی سفارش: مصنوعی ذہانت کی حقیقی صلاحیت کو آزاد کرنا آج کی تیز رفتار ٹیکنالوجی کی ترقی میں، مصنوعی...

2026 سال کے ٹاپ 10 AWS ٹولز اور وسائل کی سفارشTechnology

2026 سال کے ٹاپ 10 AWS ٹولز اور وسائل کی سفارش

2026 سال کے ٹاپ 10 AWS ٹولز اور وسائل کی سفارش تیزی سے ترقی پذیر کلاؤڈ کمپیوٹنگ کے میدان میں، Amazon Web Services (AWS) ...