Agent Skills mikil nýjung! Anthropic uppfærir færni verksmiðjuna með kjarnorku-eval kerfi, þróunaraðili: gömlu færnirnar lifna við
Agent Skills mikil nýjung! Anthropic uppfærir færni verksmiðjuna með kjarnorku-eval kerfi, þróunaraðili: gömlu færnirnar lifna við
智猩猩AI整理 | 编辑:汐汐
Í heimi AI aðgerða, ef þú hefur notað Agent Skills, þá veistu örugglega um skill-creator, þetta er zero-code byggingarverkfæri sem Anthropic gaf út árið 2025.
En eftir að hafa byggt færni, er enn ómögulegt að vita hvort þessi færni sé gagnleg, hvort nýja líkanið sé nothæft, hvort það sé nákvæmt, hvernig árangurinn sé...
Á 3. mars, birti opinber bloggsíða Anthropic smá uppfærslu sem kallast Improving skill-creator: Test, measure, and refine Agent Skills. Þessi uppfærsla gerir "færni verksmiðju" Claude að raunverulegu þroska.
Frá "virðist vera nothæft" til "testanlegt, mælanlegt, endurbætanlegt", leysti það algerlega stærsta vandamál færni höfundanna, sem er "er færnin sem ég gerði eiginlega nothæf?"
01 - Endurskoðun á Agent Skills: lykilskref frá almennum aðstoðarmanni til sérfræðings
Í október 2025 kynnti Anthropic formlega Agent Skills, sem er modulært, endurnýtanlegt "færnipakka" kerfi. Ein skrá inniheldur SKILL.md leiðbeiningar, skriftur, auðlindir, og Claude hleður þeim sjálfkrafa þegar þörf krefur, sem eykur verulega frammistöðu í skjala gerð, gagna greiningu, og vörumerki samræmi.
Færnir hafa náð yfir Claude.ai, Claude Code, API alla vettvanginn, og opnað GitHub geymslu (nú þegar yfir 80.000 stjörnur). En stærsta takmörkun snemma útgáfunnar var að ófaglegir notendur gátu aðeins endurbætt út frá tilfinningu, ekki hægt að mæla árangur.
Færnir eru af tveimur gerðum:
1. Færni eflandi
Módel sem "getur ekki" eða "getur ekki verið stöðugt" getur með því að nota Færni innleitt sérstakar tækni, mynstur til að tryggja stöðuga framleiðslu.
2. Valferli kóðun
Módel getur gert hvert skref, en þarf að fylgja ströngum ferlum sem eru sérstakir fyrir teymið.
Fimm aðal atriði þessarar uppfærslu:
- Evals (sjálfvirk mat): Notendur þurfa aðeins að lýsa "prófunar leiðbeiningum + væntanlegum úttak" skill-creator keyrir sjálfkrafa staðfestingu.
- Benchmark mód: keyrir staðlaðar prófanir í hópum, úttak samþykkis, tíma, Token neyslu o.s.frv.
- Fjölverka framkvæmd: sjálfstæðar hreinar aðstæður, forðast mengun, prófunarhraði eykst.
- Comparator (blind prófun): A/B prófun tveggja færni útgáfa.
- Description Tuning (lýsinga endurbætur): sjálfvirk greining á sýnishornum, leggur til breytingar á lýsingu.
02 - Engin ástæða til að ekki setja upp! Þessi uppfærsla gerir gömlu færnirnar að lifna við
Uppfærsla Anthropic á skill-creator hefur fljótt vakið umræður meðal AI Agent atvinnumanna og þróunaraðila.
03 - CI/CD tími AI aðgerða: frá listaverki í verkfræðivöru
Uppfærsla Anthropic á skill-creator er í raun að færa þá bestu "prófun - staðla - endurbætur" hringrás sem er til í hugbúnaðarverkfræði, á lágu skrefi til venjulegra notenda og fyrirtækja. Þetta þýðir að Agent Skills eru ekki lengur "skrifað og hent" einnota prompt verk, heldur er hægt að viðhalda þeim, samhæfa milli módel útgáfa, og hægt að gagnavinna til að bæta "lifandi eignir".
Á stuttum tíma, eru aðalhagsmunaaðilar þeir sem þegar hafa safnað miklu af sérsniðnum færnum í Claude Code / Cowork.
Og ef litið er á víðara sjónarhorn, þá styrkir þessi uppfærsla enn frekar "verkfæri keðju varnarvegg" Anthropic í Agent vistkerfinu.

