بعد اختبار MiniMax M2.5، بدأت أتساءل عما إذا كنت سأجدد اشتراكي في Claude أم لا...
صدر MiniMax M2.5! قمت على الفور بتوصيله بـ Claude Code لإجراء الاختبارات.
هذه المرة الأمر مختلف حقًا، فالنتائج التي أعلنتها MiniMax رسميًا مذهلة للغاية.
حصل على 80.2٪ في SWE-Bench Verified، وحصل على المركز الأول مباشرةً في البرمجة متعددة اللغات Multi-SWE-Bench، كما أن قدرة البحث BrowseComp هي أيضًا على مستوى SOTA بنسبة 76.3٪.
أوصى Peter Steinberger، مؤسس OpenClaw، بسلسلة نماذج MiniMax عدة مرات في المقابلات السابقة، وهذه المرة قام بإعادة توجيه منشور مباشرةً بعد إصدار M2.5:
\أطلب إنشاء منصة تعاون تجاري لـ KOL، مع لوحة بيانات تعرض بيانات المؤثرين وملفات تعريف الجمهور وعروض الأسعار، ونظام مطابقة ذكي يسمح للعلامات التجارية بإدخال المتطلبات ثم توصي الذكاء الاصطناعي بـ KOL المناسبين، وتقويم المواعيد يعرض بشكل مرئي الجداول الزمنية للأشهر الثلاثة القادمة، بالإضافة إلى مكتبة قوالب العقود وتقارير تتبع البيانات.
يجب أن يكون النمط المرئي مثل تخطيط بطاقات Instagram بالإضافة إلى نمط لوحة معلومات B2B SaaS.
طريقة معالجتها أكثر منهجية من الحالة الأولى.
أولاً، يتم تفكيك الوحدات الوظيفية، وتصميم الأنظمة الفرعية للوحة البيانات وخوارزمية المطابقة ومكون التقويم وإدارة المستندات على التوالي.
ثم يتم ربطها في الواجهة الأمامية بتخطيط تدفق البطاقات، ويتم تشغيل منطق الواجهة الخلفية ببيانات محاكاة لتشغيل العملية بأكملها.
الشيء المثير للاهتمام هو أنه عند القيام بوظيفة المطابقة الذكية، سيتم تصميم نسخة مبسطة من خوارزمية التوصية بشكل استباقي، على الرغم من أنها ليست نموذج تعلم آلي حقيقي، إلا أن المنطق القائم على مطابقة العلامات يمكن أن يعرض المفهوم الأساسي.
استغرق المشروع بأكمله حوالي 20 دقيقة من التطوير. هذا المستوى من التعقيد، إذا تم العثور على فريق تطوير للقيام به، فمن المستحيل إنجازه في أقل من شهر أو شهرين.
وعلي أن أقول إن هذه القدرة ذات قيمة كبيرة لرواد الأعمال.
إذا كانت لديك فكرة تجارية وترغب في إنشاء MVP بسرعة للتحقق من السوق، فيمكنك استخدام هذه الطريقة لإنشاء نموذج أولي للمنتج أولاً، ثم تحديد ما إذا كنت تريد استثمار الموارد في التطوير الرسمي.

الحالة الثالثة: منصة تعليمية عبر الإنترنت للجمالية الصينية الجديدة
في الحالة الثالثة، أود أن أجرب أدائها في الاتجاه الإبداعي الثقافي. لا تتضمن هذه الأنواع من المتطلبات مجرد تحقيق الوظائف، ولكنها تتضمن أيضًا الجماليات وخلق الجو، وهو غالبًا ما يكون نقطة ضعف الذكاء الاصطناعي.
أطلب إنشاء موقع ويب لمنصة التعليم الوطني الكلاسيكي عبر الإنترنت Shiguang Shuyuan، مع جمالية صينية جديدة. يجب أن تكون الألوان متدرجة من الأبيض الكريمي والأسود الحبر والأحمر القرمزي، ويجب وضع أعمال الخط أو المناظر الطبيعية بالحبر على الخلفية، مع إضافة تأثير تناثر الجسيمات. دمج عناصر الكتب القديمة مثل لفائف الخيزران والأختام، واستخدام تخطيط عمودي لخط Song للكلمات. يجب أن يبدو كل مربع عرض للدورة التدريبية مثل كتاب مخيط بالخيوط، مع تشغيل مقاطع فيديو للقيثارة القديمة أو حفل الشاي في الخلفية. يجب أن يكون الجو العام أنيقًا وهادئًا، مثل الشعور بتذوق الشاي ومناقشة Tao في الدراسة.
في عملية التنفيذ، أظهرت القدرة على فهم الرموز الثقافية.
بالإضافة إلى تحقيق النمط المرئي الأساسي، فإنه سيقوم أيضًا بعمل على التفاصيل، مثل إضافة رسم بالحبر للرسوم المتحركة الانتقالية لتبديل الصفحة، وإضافة علامات نمط الختم إلى بطاقات الدورة التدريبية، وحتى تشغيل مسار كتابة الفرشاة عند تمرير الماوس.
هذه الأفكار الصغيرة تجعل الصفحة بأكملها حيوية، وليست مجرد كومة من التعليمات البرمجية الباردة.
النتيجة هي أنني أرسلت هذا العرض التوضيحي إلى صديق يعمل في مجال الاتصالات الثقافية، وكان رد فعله الأول هو سؤالي عن الشركة التي صممته.
عندما أخبرته أن الذكاء الاصطناعي هو الذي فعل ذلك، لم يصدقني على الإطلاق.
لذلك أقول، قد يتم التقليل من سرعة تطور الذكاء الاصطناعي على المستوى الجمالي. إنه لا يقلد تصميم الإنسان فحسب، بل إنه يفهم حقًا الدلالات الثقافية والتعبير العاطفي.

ملخص
بعد اختبار هذه الحالات القليلة، أشعر أن قدرة MiniMax M2.5 على مستوى التنفيذ قوية حقًا.
يمكنه فهم المتطلبات المعقدة، ويمكنه تخطيط خطوات المهمة بنفسه، والسرعة سريعة بشكل لا يصدق. يقول المسؤولون إن سرعة الاستدلال تبلغ 3 أضعاف سرعة Opus، وأشعر أنها كذلك بعد الاختبار.
إذا كنت غالبًا ما تتأخر بسبب التفاصيل التافهة على مستوى التنفيذ، فأنصحك بشدة باختباره بنفسك. واجهة برمجة التطبيقات API مفتوحة الآن أيضًا، والمفتاح هو ما إذا كان يمكن دمجها حقًا في سير عملك.
بصراحة، في هذه المرحلة من تطور الذكاء الاصطناعي، لم تعد المشكلة هي ما إذا كان يمكن استخدامه، ولكن ما إذا كان سيتم استخدامه.ابدأ مبكرًا، واستفد مبكرًا.





