หลังจากทดลอง MiniMax M2.5 เสร็จ ฉันเริ่มสงสัยว่าควรต่ออายุ Claude ดีไหม...
MiniMax M2.5 ออกแล้ว! ฉันรีบเชื่อมต่อกับ Claude Code เพื่อทดสอบทันที
ครั้งนี้ไม่เหมือนเดิมจริงๆ MiniMax ประกาศผลการทดสอบที่น่าทึ่งมาก
SWE-Bench Verified ได้ 80.2%, Multi-SWE-Bench การเขียนโปรแกรมหลายภาษาก็เป็นอันดับหนึ่งโดยตรง, BrowseComp ความสามารถในการค้นหาก็อยู่ในระดับ SOTA ที่ 76.3%
Peter Steinberger ผู้ก่อตั้ง OpenClaw เคยแนะนำโมเดล MiniMax หลายครั้งในการสัมภาษณ์ ก่อนหน้านี้ พอ M2.5 ออกมา เขาก็แชร์โพสต์ทันที:
"MiniMax เพิ่งเปิดตัว MiniMaxM2.5 ซึ่งมีประสิทธิภาพเทียบเท่ากับ Opus4.6 แต่ราคาถูกกว่า 20 เท่า!"
ฉันอยากแนะนำให้ทุกคนลองด้วยตัวเองจริงๆ M2.5 เป็นเหมือนเทพเจ้าสำหรับนักพัฒนา มีความสามารถในการพัฒนาที่แข็งแกร่งมาก!
หลังจากที่ฉันได้ใช้ M2.5 ฉันเริ่มสงสัยว่าจำเป็นต้องต่ออายุ Claude ในเดือนหน้าหรือไม่...

ข้อได้เปรียบหลัก
สุนทรียภาพและความสมบูรณ์ของ M2.5 นั้นสูงมาก โดยเฉพาะอย่างยิ่งมีความเชี่ยวชาญในการจัดการกับความต้องการในการพัฒนาที่ซับซ้อนมาก ทุกคนสามารถดูตัวอย่างที่ 2 ของฉันได้ในภายหลัง ซึ่งทำออกมาได้ดีมาก ในตอนนั้นมันใช้เวลาประมาณ 20 นาทีเท่านั้น
เจ้าหน้าที่เรียก MiniMax M2.5 ว่าสถาปัตยกรรมดั้งเดิมของ Intelligent Agent กล่าวอีกนัยหนึ่ง โมเดลนี้เกิดมาเพื่อทำงาน
ปริมาณพารามิเตอร์ที่ใช้งานอยู่มีเพียง 10B เมื่อเทียบกับ Claude Opus 4 ซึ่งเป็นโมเดลเรือธงที่มีพารามิเตอร์หลายร้อย B แต่ M2.5 สามารถแข่งขันกับเรือธงชั้นนำในด้านการเขียนโปรแกรม การประมวลผลเอกสาร และการดำเนินงานที่ซับซ้อน
เมื่อเร็วๆ นี้ ฉันสังเกตเห็นว่าเพื่อนๆ หลายคนรอบตัวฉันกำลังทำโครงการพัฒนาเว็บไซต์ หรือแพลตฟอร์มเชิงพาณิชย์ และยังต้องเสียเงินจ้าง Outsource อีกด้วย
แต่ฉันต้องบอกว่า MiniMax M2.5 สามารถทำงานเหล่านี้ได้ และผลลัพธ์ก็ไม่แพ้แพลตฟอร์มออนไลน์หลายแห่งเลย...
ฉันได้ทำการทดสอบ 3 สถานการณ์ ครอบคลุมการพัฒนาเว็บไซต์ส่วนตัว การสร้างแพลตฟอร์มเชิงพาณิชย์ และการสร้างแพลตฟอร์มการศึกษาออนไลน์ มาดูกันว่า MiniMax M2.5 มีประสิทธิภาพในการใช้งานจริงอย่างไร 👇
กรณีศึกษา
Case 1: บล็อกเกอร์ด้านความงามต้องการสร้างเว็บไซต์แบรนด์ส่วนตัว
เมื่อไม่นานมานี้ เพื่อนที่ทำสื่อด้วยตนเองด้านความงามมาปรึกษาฉัน บอกว่าเธอต้องการใช้ AI สร้างเว็บไซต์ส่วนตัว เพื่อแสดงผลงานโซเชียลมีเดียของเธอ เพื่อให้สะดวกสำหรับลูกค้า
แต่เธอไม่เข้าใจโค้ดเลย และการจ้าง Outsource ภายนอกมีราคาเริ่มต้นหลายพันบาท
จากความต้องการนี้ ฉันจึงอยากลองดูว่าสามารถใช้ MiniMax M2.5 ทำได้ในขั้นตอนเดียวหรือไม่
มันวางแผนโครงสร้างทางเทคนิคและโครงสร้างไดเรกทอรีของเว็บไซต์ทั้งหมดก่อน จากนั้นจึงเริ่มสร้างโค้ดทีละหน้า
ในบางแห่ง มันจะปรับปรุงโดยอัตโนมัติ เช่น ปรับจำนวนคอลัมน์ของ Waterfall Layout โดยอัตโนมัติบนอุปกรณ์เคลื่อนที่ และเพิ่มแอนิเมชั่นการเปลี่ยนภาพที่ราบรื่นให้กับพื้นหลังไล่ระดับสี
กระบวนการทั้งหมดใช้เวลาเพียงสามนาทีกว่าๆ และสร้างโค้ด HTML, CSS และ Responsive Layout ที่สมบูรณ์
จะเห็นได้ว่าคุณค่าในการใช้งานจริงนั้นชัดเจนมาก โดยเฉพาะอย่างยิ่งสำหรับบล็อกเกอร์ส่วนตัว สตูดิโอขนาดเล็ก และกลุ่มที่มีงบประมาณจำกัด ความสามารถนี้จะลดต้นทุนการสร้างเว็บไซต์จากหลายหมื่นบาทเหลือศูนย์โดยตรง
คุณเพียงแค่ระบุความต้องการ ส่วนงานด้านเทคนิคที่เหลือทั้งหมดจะมอบให้ AI
Case 2: ระบบที่ซับซ้อนของแพลตฟอร์มความร่วมมือเชิงพาณิชย์ของ KOL
กรณีนี้มีความยากเพิ่มขึ้นอีกระดับ สิ่งที่ฉันต้องการทดสอบคือความสามารถในการจัดการกับผลิตภัณฑ์ประเภทแพลตฟอร์มที่มีตรรกะทางธุรกิจที่แท้จริง ไม่ใช่แค่การสร้างเว็บไซต์แสดงผลเท่านั้นฉันต้องการสร้างแพลตฟอร์มความร่วมมือทางธุรกิจ KOL ที่มีแผงข้อมูลอินฟลูเอนเซอร์ที่แสดงภาพลักษณ์ของแฟนๆ และราคา ระบบจับคู่อัจฉริยะที่ให้แบรนด์ป้อนความต้องการ จากนั้น AI จะแนะนำ KOL ที่เหมาะสม ปฏิทินกำหนดการแสดงกำหนดการในอีกสามเดือนข้างหน้าอย่างเห็นภาพ นอกจากนี้ยังมีคลังเทมเพลตสัญญาและรายงานการติดตามข้อมูล
สไตล์ภาพควรเป็นเหมือนเลย์เอาต์การ์ด Instagram ผสมผสานกับสไตล์แดชบอร์ด B2B SaaS
วิธีการจัดการของมันเป็นระบบมากกว่ากรณีแรก
ขั้นแรกคือการแยกส่วนประกอบฟังก์ชัน และออกแบบระบบย่อยต่างๆ เช่น แผงข้อมูล อัลกอริทึมการจับคู่ ส่วนประกอบปฏิทิน และการจัดการเอกสาร
จากนั้นเชื่อมต่อเข้าด้วยกันในส่วนหน้าด้วยเลย์เอาต์สตรีมการ์ด และใช้ข้อมูลจำลองเพื่อรันตรรกะส่วนหลังให้ทั่วทั้งกระบวนการ
สิ่งที่น่าสนใจคือ เมื่อมันสร้างฟังก์ชันการจับคู่อัจฉริยะ มันจะออกแบบอัลกอริทึมการแนะนำแบบง่าย แม้ว่าจะไม่ใช่โมเดลการเรียนรู้ของเครื่องจริงๆ แต่ตรรกะที่ใช้การจับคู่แท็กก็สามารถแสดงแนวคิดหลักได้แล้ว
ทั้งโครงการใช้เวลาในการพัฒนาประมาณ 20 กว่านาที ความซับซ้อนระดับนี้ หากหาทีมพัฒนามาทำ แทบจะต้องใช้เวลาหนึ่งถึงสองเดือน
และฉันต้องบอกว่าความสามารถนี้มีมูลค่ามหาศาลสำหรับผู้ประกอบการ
หากคุณมีไอเดียทางธุรกิจ และต้องการสร้าง MVP อย่างรวดเร็วเพื่อตรวจสอบตลาด คุณสามารถใช้วิธีนี้เพื่อสร้างต้นแบบผลิตภัณฑ์ก่อน แล้วค่อยตัดสินใจว่าจะลงทุนทรัพยากรเพื่อพัฒนาอย่างเป็นทางการหรือไม่

กรณีที่ 3: แพลตฟอร์มการศึกษาออนไลน์ด้านสุนทรียศาสตร์แบบจีนใหม่
กรณีที่สาม ฉันต้องการลองดูประสิทธิภาพของมันในด้านความคิดสร้างสรรค์ทางวัฒนธรรม ความต้องการประเภทนี้ไม่ได้เป็นเพียงการใช้งานฟังก์ชันเท่านั้น แต่ยังเกี่ยวข้องกับสุนทรียภาพและการสร้างบรรยากาศ ซึ่งมักเป็นจุดอ่อนของ AI
ฉันต้องการให้สร้างเว็บไซต์สำหรับแพลตฟอร์มการศึกษาออนไลน์ด้านวัฒนธรรมจีนดั้งเดิมชื่อ Shiguang Shuyuan โดยมีสุนทรียศาสตร์แบบจีนใหม่ โทนสีควรเป็นสีขาวนวล สีหมึก และสีแดงชาดแบบไล่ระดับสี พื้นหลังควรเป็นงานเขียนพู่กันหรือภาพวาดทิวทัศน์หมึกจีน พร้อมเอฟเฟกต์อนุภาคที่ลอยฟุ้ง ผสมผสานองค์ประกอบหนังสือโบราณ เช่น ม้วนไม้ไผ่ ตราประทับ ตัวอักษรควรเป็นแบบเรียงแนวตั้งของ Songti กรอบแสดงผลแต่ละหลักสูตรควรเหมือนหนังสือเย็บเล่ม พื้นหลังควรเล่นวิดีโอพิณโบราณหรือพิธีชงชา บรรยากาศโดยรวมควรสง่างามและเงียบสงบ เหมือนอยู่ในห้องหนังสือจิบชาและสนทนา
ในระหว่างการดำเนินการ มันแสดงให้เห็นถึงความสามารถในการเข้าใจสัญลักษณ์ทางวัฒนธรรม
นอกเหนือจากการใช้งานสไตล์ภาพพื้นฐานแล้ว มันยังใส่ใจในรายละเอียด เช่น เพิ่มแอนิเมชั่นเปลี่ยนหน้าแบบหมึกซึม เพิ่มแท็กสไตล์ตราประทับบนการ์ดหลักสูตร และแม้กระทั่งทริกเกอร์แอนิเมชั่นเส้นทางการเขียนพู่กันเมื่อวางเมาส์เหนือ
ความคิดเล็กๆ น้อยๆ เหล่านี้ทำให้ทั้งหน้ามีชีวิตชีวา ไม่ใช่แค่การวางโค้ดที่เย็นชา
ผลลัพธ์คือฉันส่งเดโมนี้ให้เพื่อนที่ทำงานด้านการเผยแพร่วัฒนธรรมดู ปฏิกิริยาแรกของเธอคือถามว่าฉันหาบริษัทออกแบบจากที่ไหน
เมื่อฉันบอกเธอว่า AI เป็นคนทำ เธอไม่เชื่อเลย
ดังนั้นฉันจึงบอกว่า ความเร็วในการวิวัฒนาการของ AI ในระดับสุนทรียภาพอาจถูกประเมินต่ำเกินไป มันไม่ได้แค่เลียนแบบการออกแบบของมนุษย์ แต่กำลังเข้าใจความหมายทางวัฒนธรรมและการแสดงออกทางอารมณ์อย่างแท้จริง

สรุป
หลังจากทดสอบกรณีเหล่านี้ ฉันรู้สึกว่าความสามารถของ MiniMax M2.5 ในระดับการดำเนินการนั้นแข็งแกร่งจริงๆ
มันสามารถเข้าใจความต้องการที่ซับซ้อน สามารถวางแผนขั้นตอนงานได้เอง และความเร็วก็เร็วจนน่าเหลือเชื่อ ทางการบอกว่าความเร็วในการอนุมานเร็วกว่า Opus ถึง 3 เท่า จากการทดสอบของฉัน ฉันรู้สึกว่ามันเป็นเช่นนั้นจริงๆ
หากคุณมักถูกรบกวนจากเรื่องเล็กๆ น้อยๆ ในระดับการดำเนินการ ขอแนะนำให้คุณทดสอบด้วยตัวเอง ตอนนี้ API interface ก็เปิดให้ใช้งานแล้ว สิ่งสำคัญคือดูว่ามันสามารถผสานรวมเข้ากับขั้นตอนการทำงานของคุณได้อย่างแท้จริงหรือไม่
พูดตามตรง การพัฒนา AI มาถึงจุดนี้แล้ว ไม่ใช่ปัญหาว่าจะใช้งานได้หรือไม่ แต่เป็นปัญหาว่าจะใช้งานเป็นหรือไม่เริ่มต้นเร็ว ได้ประโยชน์เร็ว





