Agent Skills merkittävä uudistus! Anthropic päivittää taitotehtaan ydinpommitason evals-järjestelmään, kehittäjät: vanhat taidot herätetään henkiin
Agent Skills merkittävä uudistus! Anthropic päivittää taitotehtaan ydinpommitason evals-järjestelmään, kehittäjät: vanhat taidot herätetään henkiin
Älykäs AI kokoaa | Toimittaja: Xi Xi
AI-agenttien kentässä, jos olet käyttänyt Agent Skillsia, tunnet varmasti skill-creatorin, joka on Anthropicin julkaisema vuonna 2025 julkaistu taitojen nollakoodin rakennustyökalu.
Kuitenkin, kun taito on rakennettu, ei vieläkään tiedetä, onko tämä taito hyödyllinen, voiko uusi malli toimia, onko se tarkka, ja miten se toimii...
"Näyttää toimivalta" -tilasta "testattavaksi, mitattavaksi ja iteratiiviseksi" on täysin ratkaistu aikaisempien taitojen tekijöiden suurin kipupiste, eli "onko tekemäni taito oikeasti hyödyllinen?"
01 - Agent Skillsin katsaus: avainaskel yleisestä avustajasta asiantuntevaksi agentiksi
Lokakuussa 2025 Anthropic julkaisi virallisesti Agent Skillsin, joka on modulaarinen, uudelleenkäytettävä "taitopaketti" -järjestelmä. Yhdessä kansiossa on SKILL.md-ohjeet, skriptit ja resurssit, ja Claude lataa ne automaattisesti tarvittaessa, mikä parantaa merkittävästi asiakirjojen luontia, tietoanalyysiä, brändin vaatimustenmukaisuutta ja muita sovelluksia.
Taidot kattavat Claude.ai:n, Claude Coden ja API:n koko alustan, ja GitHub-varasto on avattu (tällä hetkellä yli 80 000 tähteä). Mutta aikaisempien versioiden suurin rajoitus oli se, että ei-tekniset käyttäjät pystyivät vain tuntemuksensa perusteella iteratiivisesti kehittämään, eivätkä he voineet kvantifioida vaikutuksia.
Taitoja on kahta tyyppiä:
1. Kykyjen parantaminen
Malli ei alun perin "voinut" tai "toiminut epävakaasti" asioita, mutta Skillsin avulla voidaan injektoida erityisiä taitoja ja malleja, jotta tulokset olisivat vakaampia.
2. Mieltymyskoodaus
Malli voi tehdä jokaisen vaiheen, mutta se tarvitsee tiimin erityisten prosessien mukaisen tiukan järjestyksen.
Tämän päivityksen 5 suurta kohokohtaa:
- Evals (automaattinen arviointi): Käyttäjän tarvitsee vain kuvata "testivihje + odotettu tulos", skill-creator suorittaa automaattisesti vahvistuksen.
- Benchmark-tila: Suoritetaan standardoituja testejä suurissa erissä, ja tuloksena saadaan läpäisyprosentti, kesto, Token-kulutus ja muita kovia mittareita.
- Moniagenttinen rinnakkaissuoritus: Itsenäinen puhdas konteksti, joka estää saastumisen, testausnopeus kasvaa räjähdysmäisesti.
- Comparator (sokkotestaus): A/B-testaus kahden taitoversion välillä.
- Description Tuning (kuvausoptimointi): Automaattinen analyysi näytteen vihjeistä, ehdotetaan kuvausten muokkaamista.
02 - Ei syytä olla asentamatta! Tämä päivitys herättää vanhat taidot henkiin
Anthropicin skill-creatorin päivitys on nopeasti herättänyt keskustelua AI-agenttien ammattilaisten ja kehittäjien keskuudessa.
03 - AI-agenttien CI/CD hetki: taideteoksista insinöörituotteiksi
Anthropicin skill-creatorin päivitys on pohjimmiltaan tuonut ohjelmistosuunnittelun kypsimmän "testaus-vertailu-iterointi" -silmukan matalan kynnyksen kautta tavallisille käyttäjille ja yritysryhmille. Tämä tarkoittaa, että Agent Skills ei ole enää "kirjoita ja heitä pois" -kertakäyttöinen prompt-työ, vaan se on jatkuvasti ylläpidettävä, eri malliversioiden yhteensopiva ja datan avulla optimoitava "elävä omaisuus".
Lyhyellä aikavälillä suurin hyötyjä on kehittäjät ja yrityskäyttäjät, jotka ovat jo keränneet suuren määrän mukautettuja taitoja Claude Codessa / Coworkissa.
Ja laajemmasta näkökulmasta tämä päivitys vahvistaa edelleen Anthropicin "työkaluketjun suojamuuria" Agent-ekosysteemissä.

