Agent Skills mikil nýjung! Anthropic uppfærir færni verksmiðjuna með kjarnorku-eval kerfi, þróunaraðili: gömlu færnirnar lifna við

智猩猩AI整理 | 编辑：汐汐

Í heimi AI aðgerða, ef þú hefur notað Agent Skills, þá veistu örugglega um skill-creator, þetta er zero-code byggingarverkfæri sem Anthropic gaf út árið 2025.

En eftir að hafa byggt færni, er enn ómögulegt að vita hvort þessi færni sé gagnleg, hvort nýja líkanið sé nothæft, hvort það sé nákvæmt, hvernig árangurinn sé...

Á 3. mars, birti opinber bloggsíða Anthropic smá uppfærslu sem kallast Improving skill-creator: Test, measure, and refine Agent Skills. Þessi uppfærsla gerir "færni verksmiðju" Claude að raunverulegu þroska.

Frá "virðist vera nothæft" til "testanlegt, mælanlegt, endurbætanlegt", leysti það algerlega stærsta vandamál færni höfundanna, sem er "er færnin sem ég gerði eiginlega nothæf?"

01 - Endurskoðun á Agent Skills: lykilskref frá almennum aðstoðarmanni til sérfræðings

Í október 2025 kynnti Anthropic formlega Agent Skills, sem er modulært, endurnýtanlegt "færnipakka" kerfi. Ein skrá inniheldur SKILL.md leiðbeiningar, skriftur, auðlindir, og Claude hleður þeim sjálfkrafa þegar þörf krefur, sem eykur verulega frammistöðu í skjala gerð, gagna greiningu, og vörumerki samræmi.

Færnir hafa náð yfir Claude.ai, Claude Code, API alla vettvanginn, og opnað GitHub geymslu (nú þegar yfir 80.000 stjörnur). En stærsta takmörkun snemma útgáfunnar var að ófaglegir notendur gátu aðeins endurbætt út frá tilfinningu, ekki hægt að mæla árangur.

Færnir eru af tveimur gerðum:

1. Færni eflandi

Módel sem "getur ekki" eða "getur ekki verið stöðugt" getur með því að nota Færni innleitt sérstakar tækni, mynstur til að tryggja stöðuga framleiðslu.

2. Valferli kóðun

Módel getur gert hvert skref, en þarf að fylgja ströngum ferlum sem eru sérstakir fyrir teymið.

Fimm aðal atriði þessarar uppfærslu:

Evals (sjálfvirk mat): Notendur þurfa aðeins að lýsa "prófunar leiðbeiningum + væntanlegum úttak" skill-creator keyrir sjálfkrafa staðfestingu.
Benchmark mód: keyrir staðlaðar prófanir í hópum, úttak samþykkis, tíma, Token neyslu o.s.frv.
Fjölverka framkvæmd: sjálfstæðar hreinar aðstæður, forðast mengun, prófunarhraði eykst.
Comparator (blind prófun): A/B prófun tveggja færni útgáfa.
Description Tuning (lýsinga endurbætur): sjálfvirk greining á sýnishornum, leggur til breytingar á lýsingu.

02 - Engin ástæða til að ekki setja upp! Þessi uppfærsla gerir gömlu færnirnar að lifna við

Uppfærsla Anthropic á skill-creator hefur fljótt vakið umræður meðal AI Agent atvinnumanna og þróunaraðila.

03 - CI/CD tími AI aðgerða: frá listaverki í verkfræðivöru

Uppfærsla Anthropic á skill-creator er í raun að færa þá bestu "prófun - staðla - endurbætur" hringrás sem er til í hugbúnaðarverkfræði, á lágu skrefi til venjulegra notenda og fyrirtækja. Þetta þýðir að Agent Skills eru ekki lengur "skrifað og hent" einnota prompt verk, heldur er hægt að viðhalda þeim, samhæfa milli módel útgáfa, og hægt að gagnavinna til að bæta "lifandi eignir".

Á stuttum tíma, eru aðalhagsmunaaðilar þeir sem þegar hafa safnað miklu af sérsniðnum færnum í Claude Code / Cowork.

Og ef litið er á víðara sjónarhorn, þá styrkir þessi uppfærsla enn frekar "verkfæri keðju varnarvegg" Anthropic í Agent vistkerfinu.

Agent Skills mikil nýjung! Anthropic uppfærir færni verksmiðjuna með kjarnorku-eval kerfi, þróunaraðili: gömlu færnirnar lifna við

Agent Skills mikil nýjung! Anthropic uppfærir færni verksmiðjuna með kjarnorku-eval kerfi, þróunaraðili: gömlu færnirnar lifna við

01 - Endurskoðun á Agent Skills: lykilskref frá almennum aðstoðarmanni til sérfræðings

Færnir eru af tveimur gerðum:

1. Færni eflandi

2. Valferli kóðun

Fimm aðal atriði þessarar uppfærslu:

02 - Engin ástæða til að ekki setja upp! Þessi uppfærsla gerir gömlu færnirnar að lifna við

03 - CI/CD tími AI aðgerða: frá listaverki í verkfræðivöru

You Might Also Like

Claude Code Buddy breytingarleiðbeiningar: Hvernig á að fá glitrandi goðsagnir dýr

Obsidian hefur gefið út Defuddle, sem lyftir Obsidian Web Clipper á nýjan hæð

OpenAI tilkynnti skyndilega "þrjú í eitt": Vafri + forritun + ChatGPT sameining, innanhúss viðurkenndu þau að hafa farið rangt að síðasta árið

2026, ekki lengur að þrýsta á sjálfan sig "sjálfsaga"! Gerðu þessar 8 litlu hluti, heilsa kemur náttúrulega

Mæðurnar sem reyna að léttast en ná ekki árangri, eru örugglega að lenda í þessu

AI Browser 24 tíma stöðugleika leiðbeiningar