Sau khi thử nghiệm MiniMax M2.5, tôi bắt đầu nghi ngờ liệu có nên gia hạn Claude nữa không...

2/15/2026
6 min read

MiniMax M2.5 đã ra mắt! Tôi đã ngay lập tức kết nối với Claude Code để thử nghiệm.

Lần này thực sự khác biệt, bảng thành tích chính thức được MiniMax công bố khá ấn tượng.

SWE-Bench Verified đạt 80.2%, Multi-SWE-Bench lập trình đa ngôn ngữ trực tiếp đứng đầu, khả năng tìm kiếm BrowseComp cũng đạt mức SOTA 76.3%.

Peter Steinberger, người sáng lập OpenClaw, trước đây đã nhiều lần giới thiệu dòng mô hình MiniMax trong các cuộc phỏng vấn. Lần này khi M2.5 ra mắt, anh ấy đã trực tiếp chia sẻ lại một bài đăng:

\Tôi yêu cầu tạo một nền tảng hợp tác kinh doanh KOL, phải có bảng điều khiển dữ liệu người nổi tiếng trên mạng hiển thị chân dung người hâm mộ và báo giá, hệ thống đối sánh thông minh cho phép nhãn hiệu nhập nhu cầu và AI đề xuất KOL phù hợp, lịch trình hiển thị trực quan lịch trình ba tháng tới, cũng như thư viện mẫu hợp đồng và báo cáo theo dõi dữ liệu.

Phong cách hình ảnh phải giống bố cục thẻ Instagram cộng với phong cách bảng điều khiển của B2B SaaS.

Cách xử lý của nó có hệ thống hơn trường hợp đầu tiên.

Đầu tiên là phân tích các mô-đun chức năng, và thiết kế các hệ thống con như bảng điều khiển dữ liệu, thuật toán đối sánh, thành phần lịch và quản lý tài liệu.

Sau đó, sử dụng bố cục luồng thẻ ở giao diện người dùng để liên kết chúng, và sử dụng dữ liệu mô phỏng để chạy toàn bộ quy trình ở logic backend.

Điều thú vị là, khi thực hiện chức năng đối sánh thông minh, nó sẽ chủ động thiết kế một phiên bản đơn giản của thuật toán đề xuất. Mặc dù không phải là mô hình học máy thực sự, nhưng logic dựa trên đối sánh thẻ đã có thể hiển thị các khái niệm cốt lõi.

Toàn bộ dự án mất khoảng hơn 20 phút để phát triển. Với mức độ phức tạp này, nếu tìm một nhóm phát triển, thì gần như không thể hoàn thành trong một hoặc hai tháng.

Và tôi phải nói rằng, khả năng này có giá trị rất lớn đối với các doanh nhân.

Nếu bạn có một ý tưởng kinh doanh và muốn nhanh chóng tạo một MVP để xác minh thị trường, bạn hoàn toàn có thể sử dụng phương pháp này để xây dựng nguyên mẫu sản phẩm trước, sau đó quyết định xem có nên đầu tư nguồn lực để phát triển chính thức hay không.

Case 3: Nền tảng giáo dục trực tuyến về thẩm mỹ Trung Hoa mới

Trường hợp thứ ba, tôi muốn thử hiệu suất của nó trong lĩnh vực sáng tạo văn hóa. Loại nhu cầu này không chỉ là thực hiện chức năng, mà còn liên quan đến thẩm mỹ và tạo không khí, đây thường là điểm yếu của AI.

Tôi yêu cầu tạo một trang web cho nền tảng giáo dục quốc học trực tuyến Shiguang Shuyuan, phải có thẩm mỹ Trung Hoa mới. Màu sắc sử dụng màu trắng gạo, màu mực và màu đỏ son chu chuyển màu, nền đặt các tác phẩm thư pháp hoặc phong cảnh sơn thủy, thêm hiệu ứng hạt bay. Kết hợp các yếu tố cổ điển như cuộn tre và con dấu, văn bản sử dụng phông chữ Song thể theo chiều dọc. Mỗi khung hiển thị khóa học phải giống như một cuốn sách chỉ khâu, nền phát video cổ cầm hoặc trà đạo. Bầu không khí tổng thể phải tao nhã và tĩnh lặng, giống như đang thưởng trà và thảo luận về Đạo trong thư phòng.

Trong quá trình thực hiện, nó thể hiện khả năng hiểu các biểu tượng văn hóa.

Ngoài việc thực hiện phong cách hình ảnh cơ bản, nó còn làm việc trên các chi tiết, chẳng hạn như thêm hiệu ứng chuyển tiếp nhòe mực cho chuyển đổi trang, thêm nhãn kiểu con dấu trên thẻ khóa học và thậm chí kích hoạt hoạt ảnh đường dẫn viết bằng bút lông khi di chuột.

Những chi tiết nhỏ này làm cho toàn bộ trang trở nên sống động, không còn là sự chồng chất của mã lạnh lùng.

Kết quả là tôi đã gửi bản demo này cho một người bạn làm truyền thông văn hóa xem, và phản ứng đầu tiên của cô ấy là hỏi tôi đã tìm công ty thiết kế nào.

Khi tôi nói với cô ấy rằng đây là do AI làm, cô ấy hoàn toàn không tin.

Vì vậy, tôi nói rằng, tốc độ tiến hóa của AI ở cấp độ thẩm mỹ có thể bị đánh giá thấp. Nó không chỉ bắt chước thiết kế của con người, mà thực sự đang hiểu nội hàm văn hóa và biểu đạt cảm xúc.

Tổng kết

Sau khi thử nghiệm các trường hợp này, tôi cảm thấy khả năng thực thi của MiniMax M2.5 thực sự đủ mạnh.

Nó có thể hiểu các yêu cầu phức tạp, có thể tự mình lên kế hoạch các bước nhiệm vụ, và tốc độ nhanh đến mức phi lý. Các quan chức nói rằng tốc độ suy luận gấp 3 lần Opus, và tôi cảm thấy như vậy sau khi thử nghiệm.

Nếu bạn cũng thường xuyên bị trì hoãn bởi những công việc vặt ở cấp độ thực thi, tôi rất khuyên bạn nên tự mình kiểm tra, hiện tại giao diện API cũng đã được mở, điều quan trọng là xem nó có thể thực sự hòa nhập vào quy trình làm việc của bạn hay không.

Thành thật mà nói, AI đã phát triển đến giai đoạn này, vấn đề không còn là có thể sử dụng được hay không, mà là có biết cách sử dụng hay không.Sớm làm quen, sớm hưởng lợi.

Published in Technology

You Might Also Like

Cách sử dụng công nghệ điện toán đám mây: Hướng dẫn đầy đủ để xây dựng cơ sở hạ tầng đám mây đầu tiên của bạnTechnology

Cách sử dụng công nghệ điện toán đám mây: Hướng dẫn đầy đủ để xây dựng cơ sở hạ tầng đám mây đầu tiên của bạn

Cách sử dụng công nghệ điện toán đám mây: Hướng dẫn đầy đủ để xây dựng cơ sở hạ tầng đám mây đầu tiên của bạn Giới thiệu...

Cảnh báo! Cha đẻ của Claude Code thẳng thắn: Một tháng nữa không dùng Plan Mode, danh hiệu kỹ sư phần mềm sẽ biến mấtTechnology

Cảnh báo! Cha đẻ của Claude Code thẳng thắn: Một tháng nữa không dùng Plan Mode, danh hiệu kỹ sư phần mềm sẽ biến mất

Cảnh báo! Cha đẻ của Claude Code thẳng thắn: Một tháng nữa không dùng Plan Mode, danh hiệu kỹ sư phần mềm sẽ biến mất G...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

Top 10 AI đại lý năm 2026: Phân tích điểm bán hàng cốt lõiTechnology

Top 10 AI đại lý năm 2026: Phân tích điểm bán hàng cốt lõi

Top 10 AI đại lý năm 2026: Phân tích điểm bán hàng cốt lõi Giới thiệu Với sự phát triển nhanh chóng của trí tuệ nhân tạo...

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力Technology

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力 Trong thời đại công nghệ phát triển nhanh chóng ngày nay, trí tuệ nhân tạo (AI) đã trở ...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 Trong lĩnh vực điện toán đám mây đang phát triển nhanh chóng, Amazon Web Services (AWS) luôn là ...