Setelah Mencoba MiniMax M2.5, Saya Mulai Ragu Apakah Perlu Memperpanjang Langganan Claude...
2/15/2026
6 min read
MiniMax M2.5 sudah rilis! Saya langsung mencoba dan mengujinya dengan Claude Code.
Kali ini benar-benar berbeda, hasil yang diumumkan secara resmi oleh MiniMax sangat mengejutkan.
SWE-Bench Verified mendapatkan 80.2%, Multi-SWE-Bench pemrograman multi-bahasa langsung menjadi yang pertama, kemampuan pencarian BrowseComp juga mencapai level SOTA sebesar 76.3%.
Pendiri OpenClaw, Peter Steinberger, sebelumnya telah beberapa kali merekomendasikan model seri MiniMax dalam wawancara, dan kali ini setelah M2.5 dirilis, dia langsung meneruskan sebuah postingan:
"MiniMax baru saja merilis MiniMaxM2.5, yang performanya setara dengan Opus4.6, tetapi harganya 20 kali lebih murah!"
Saya sangat merekomendasikan agar Anda mencobanya sendiri, M2.5 benar-benar dewa bagi para pengembang, dengan kemampuan pengembangan yang sangat kuat!
Setelah menggunakan M2.5, saya mulai ragu apakah perlu memperpanjang langganan Claude bulan depan...

## Keunggulan Utama
Estetika dan kelengkapan M2.5 sangat tinggi, terutama dalam menangani kebutuhan pengembangan yang sangat kompleks. Anda dapat melihat contoh kedua saya sebentar lagi, yang diselesaikan dengan sangat baik, dan hanya membutuhkan waktu sekitar 20 menit.
Secara resmi, MiniMax M2.5 disebut sebagai arsitektur asli agen cerdas (intelligent agent native architecture), dengan kata lain, model ini dilahirkan untuk bekerja.
Jumlah parameter aktifnya hanya 10B, sebagai perbandingan, model flagship seperti Claude Opus 4 memiliki ratusan B parameter. Namun, M2.5 mampu bersaing dengan model flagship teratas dalam pemrograman, pemrosesan dokumen, dan pelaksanaan tugas kompleks.
Kebetulan saya baru-baru ini mengamati bahwa banyak teman di sekitar saya yang mengerjakan proyek pengembangan situs web, atau platform komersial, masih harus mengeluarkan uang untuk mencari outsourcing.
Namun, saya harus mengatakan bahwa MiniMax M2.5 dapat melakukan semua pekerjaan ini, dan hasilnya tidak kalah dengan banyak platform online...
Saya menjalankan 3 skenario pengujian, yang mencakup pengembangan situs web pribadi, pembangunan platform komersial, dan pembangunan platform pendidikan online. Mari kita lihat bagaimana efek praktis MiniMax M2.5 👇
## Studi Kasus
### Kasus 1: Seorang Blogger Kecantikan Ingin Membuat Situs Web Merek Pribadi
Beberapa waktu lalu, seorang teman yang merupakan content creator media sosial kecantikan datang berkonsultasi kepada saya, mengatakan bahwa dia ingin menggunakan AI untuk membangun situs web pribadi untuk menampilkan beberapa karyanya di media sosial, sehingga memudahkan untuk ditunjukkan kepada klien.
Namun, dia sama sekali tidak mengerti kode, dan harga outsourcing di luar sana mulai dari ribuan.
Berdasarkan kebutuhan ini, saya ingin mencoba apakah saya dapat langsung menggunakan MiniMax M2.5 untuk menyelesaikannya dalam satu langkah.
Pertama, ia merencanakan seluruh technical stack dan struktur direktori situs web, kemudian mulai menghasilkan kode untuk setiap halaman.
Di beberapa tempat, ia akan secara proaktif melakukan optimasi, seperti secara otomatis menyesuaikan jumlah kolom waterfall layout di perangkat seluler, dan menambahkan animasi transisi halus ke latar belakang gradien.
Seluruh proses hanya memakan waktu sekitar tiga menit, menghasilkan kode HTML, CSS, dan responsive layout yang lengkap.
Oleh karena itu, nilai praktisnya sangat jelas, terutama bagi para blogger pribadi dan studio kecil dengan anggaran terbatas, kemampuan ini secara langsung mengurangi biaya pembuatan situs web dari puluhan juta menjadi nol.
Anda hanya perlu mengajukan permintaan, dan semua pekerjaan teknis lainnya diserahkan kepada AI.
### Kasus 2: Sistem Kompleks Platform Kerja Sama Komersial KOL
Kesulitan kasus ini meningkat satu tingkat, saya ingin menguji apakah ia dapat menangani produk platform dengan logika bisnis yang nyata, tidak hanya membuat situs web tampilan sederhana.Saya meminta pembuatan platform kolaborasi bisnis KOL, yang menampilkan panel data influencer dengan profil penggemar dan penawaran harga, sistem pencocokan cerdas yang memungkinkan merek memasukkan kebutuhan mereka dan AI merekomendasikan KOL yang sesuai, kalender jadwal yang secara visual menampilkan jadwal tiga bulan ke depan, serta perpustakaan templat kontrak dan laporan pelacakan data.
Gaya visualnya harus seperti tata letak kartu Instagram yang dipadukan dengan gaya dasbor B2B SaaS.
Penanganannya lebih sistematis daripada kasus pertama.
Pertama, modul fungsi diuraikan, dan subsistem seperti panel data, algoritma pencocokan, komponen kalender, dan manajemen dokumen dirancang secara terpisah.
Kemudian, mereka dirangkai bersama di frontend menggunakan tata letak aliran kartu, dan logika backend dijalankan melalui seluruh proses menggunakan data simulasi.
Yang menarik adalah, ketika melakukan fungsi pencocokan cerdas, ia secara proaktif merancang versi sederhana dari algoritma rekomendasi. Meskipun bukan model pembelajaran mesin yang sebenarnya, logika berbasis pencocokan tag sudah dapat menunjukkan konsep inti.
Seluruh proyek memakan waktu sekitar 20 menit untuk dikembangkan. Dengan tingkat kompleksitas ini, jika Anda mencari tim pengembangan, hampir tidak mungkin untuk menyelesaikannya dalam satu atau dua bulan.
Dan saya harus mengatakan, kemampuan ini sangat berharga bagi para pengusaha.
Jika Anda memiliki ide bisnis dan ingin dengan cepat membuat MVP untuk memvalidasi pasar, Anda dapat menggunakan metode ini untuk membuat prototipe produk terlebih dahulu, dan kemudian memutuskan apakah akan menginvestasikan sumber daya untuk pengembangan formal.

### Kasus 3: Platform Pendidikan Online Estetika Tiongkok Baru
Dalam kasus ketiga, saya ingin menguji kinerjanya dalam arah kreatif budaya. Jenis permintaan ini tidak hanya melibatkan implementasi fungsi, tetapi juga melibatkan estetika dan penciptaan suasana, yang seringkali menjadi kelemahan AI.
Saya meminta pembuatan situs web untuk platform pendidikan Guoxue online, Shiguang Shuyuan, dengan estetika Tiongkok baru. Skema warnanya harus gradien dari putih krem, tinta, dan merah vermilion, dengan karya kaligrafi atau lanskap tinta di latar belakang, dan efek partikel yang tersebar. Elemen-elemen buku kuno seperti gulungan bambu dan segel harus diintegrasikan, dan teks harus diatur secara vertikal dalam font Song. Setiap kotak tampilan kursus harus seperti buku yang dijahit dengan benang, dengan video kecapi kuno atau upacara minum teh diputar di latar belakang. Suasana keseluruhan harus elegan dan tenang, seperti merasakan teh dan berdiskusi di ruang belajar.
Selama eksekusi, ia menunjukkan pemahaman tentang simbol budaya.
Selain menerapkan gaya visual dasar, ia juga akan membuat artikel tentang detail, seperti menambahkan animasi transisi pewarnaan tinta ke peralihan halaman, menambahkan label gaya segel ke kartu kursus, dan bahkan memicu animasi jalur penulisan kuas saat mouse melayang.
Perhatian kecil ini membuat seluruh halaman menjadi hidup, bukan lagi tumpukan kode yang dingin.
Hasilnya adalah saya mengirim demo ini ke teman yang bekerja di bidang komunikasi budaya, dan reaksi pertamanya adalah bertanya kepada saya perusahaan desain mana yang saya sewa.
Ketika saya mengatakan kepadanya bahwa ini dibuat oleh AI, dia sama sekali tidak percaya.
Jadi saya katakan, kecepatan evolusi AI dalam hal estetika mungkin diremehkan. Ia tidak hanya meniru desain manusia, tetapi benar-benar memahami konotasi budaya dan ekspresi emosional.

## Kesimpulan
Setelah menguji kasus-kasus ini, saya merasa bahwa kemampuan MiniMax M2.5 di lapisan eksekusi memang cukup kuat.
Ia dapat memahami permintaan yang kompleks, merencanakan langkah-langkah tugas sendiri, dan kecepatannya sangat cepat. Pejabat mengatakan bahwa kecepatan inferensi adalah 3 kali lipat dari Opus, dan saya merasa demikian setelah pengujian.
Jika Anda juga sering terbebani oleh hal-hal sepele di lapisan eksekusi, saya sangat menyarankan Anda untuk mengujinya sendiri. Antarmuka API sekarang juga telah dibuka, dan kuncinya adalah melihat apakah ia benar-benar dapat diintegrasikan ke dalam alur kerja Anda.
Sejujurnya, pada tahap perkembangan AI saat ini, ini bukan lagi masalah apakah dapat digunakan, tetapi masalah bagaimana menggunakannya.早点上手,早点受益。
Published in Technology





