Kemajuan Besar dalam Kemahiran Ejen! Anthropic Menaik Taraf Kilang Kemahiran dengan Sistem Evals Seperti Bom Nuklear, Pembangun: Kemahiran Lama Hidup Semula

3/9/2026
3 min read

Kemajuan Besar dalam Kemahiran Ejen! Anthropic Menaik Taraf Kilang Kemahiran dengan Sistem Evals Seperti Bom Nuklear, Pembangun: Kemahiran Lama Hidup Semula

Penyusunan AI Cerdas | Penyunting: Xi Xi

Dalam bidang ejen AI, jika anda pernah menggunakan Kemahiran Ejen, anda pasti akan mengenali pembuat kemahiran (skill-creator), alat pembinaan kemahiran tanpa kod yang dikeluarkan oleh Anthropic pada tahun 2025.

Namun, setelah membina kemahiran, masih tiada cara untuk mengetahui sama ada kemahiran ini berguna, sama ada model baru masih boleh digunakan, sama ada ia berfungsi dengan tepat, dan bagaimana kesannya...

Pada 3 Mac, blog rasmi Anthropic secara senyap menerbitkan kemas kini besar yang dipanggil Meningkatkan pembuat kemahiran: Uji, ukur, dan perhalusi Kemahiran Ejen. Kemas kini ini menjadikan "kilang kemahiran" Claude benar-benar matang.

Dari "kelihatan boleh digunakan" kepada "boleh diuji, boleh diukur, boleh diulang", ia menyelesaikan sepenuhnya masalah terbesar yang dihadapi oleh penulis kemahiran sebelum ini, iaitu "Adakah kemahiran yang saya buat benar-benar berguna?"

01 - Tinjauan Kemahiran Ejen: Langkah Kunci dari Pembantu Umum ke Ejen Profesional

Pada bulan Oktober 2025, Anthropic secara rasmi melancarkan Kemahiran Ejen, yang merupakan sistem "pakej kemahiran" yang modular dan boleh digunakan semula. Sebuah folder mengandungi arahan SKILL.md, skrip, dan sumber, Claude memuatkan secara automatik apabila diperlukan, meningkatkan prestasi dalam penghasilan dokumen, analisis data, pematuhan jenama, dan banyak lagi.

Kemahiran telah meliputi Claude.ai, Claude Code, dan semua platform API, serta membuka repositori GitHub (sekarang dengan lebih daripada 80,000 bintang). Namun, batasan terbesar versi awal adalah, pengguna bukan teknikal hanya boleh mengulangi berdasarkan perasaan, tanpa dapat mengesahkan kesan secara kuantitatif.

Terdapat dua jenis Kemahiran:

1. Peningkatan Keupayaan

Apa yang model asalnya "tidak dapat" atau "tidak stabil" dapat dilakukan dengan menyuntik teknik dan pola tertentu melalui Kemahiran untuk menghasilkan output yang stabil.

2. Pengkodan Keutamaan

Model boleh melakukan setiap langkah, tetapi perlu disusun secara ketat mengikut proses tertentu pasukan.

Lima Sorotan Kemas Kini Ini:

  • Evals (Penilaian Automatik): Pengguna hanya perlu menerangkan "ujian kata kunci + bentuk output yang diharapkan" dan pembuat kemahiran akan menjalankan pengesahan secara automatik.
  • Mod Benchmark: Menjalankan ujian standard secara pukal, mengeluarkan kadar kelulusan, masa yang diambil, penggunaan Token dan lain-lain metrik keras.
  • Pelaksanaan Paralel Pelbagai Ejen: Konteks bersih dan bebas, mengelakkan pencemaran, kelajuan ujian meningkat dengan ketara.
  • Comparator (Perbandingan Buta): Ujian A/B dua versi kemahiran.
  • Description Tuning (Pengoptimuman Penerangan): Menganalisis sampel petunjuk secara automatik dan mencadangkan pengubahsuaian penerangan.

02 - Tiada Alasan untuk Tidak Memasang! Kemas Kini Ini Menghidupkan Semula Kemahiran Lama

Kemas kini Anthropic terhadap pembuat kemahiran ini dengan cepat mencetuskan perbincangan hangat di kalangan pengamal dan pembangun Ejen AI.

03 - Saat CI/CD Ejen AI: Dari Karya Seni Menjadi Produk Kejuruteraan

Kemas kini Anthropic terhadap pembuat kemahiran ini pada dasarnya membawa set "ujian - penanda aras - pengulangan" yang paling matang dalam kejuruteraan perisian kepada pengguna biasa dan pasukan syarikat dengan ambang yang rendah. Ini bermakna Kemahiran Ejen tidak lagi menjadi projek prompt sekali pakai yang "ditulis dan dibuang", tetapi boleh diselenggara secara berterusan, serasi merentasi versi model, dan boleh dioptimumkan secara data sebagai "aset hidup".

Dalam jangka pendek, penerima manfaat terbesar adalah pembangun dan pengguna syarikat yang telah mengumpul banyak kemahiran tersuai dalam Claude Code / Cowork.

Dari perspektif yang lebih makro, kemas kini ini lebih mengukuhkan "parit rantai alat" Anthropic dalam ekosistem Ejen.

Published in Technology

You Might Also Like