Agent Skills značajna inovacija! Anthropic nadogradnja vještina tvornice s nuklearnim evals sustavom, programeri: stare vještine oživljavaju

3/9/2026
3 min read

Agent Skills značajna inovacija! Anthropic nadogradnja vještina tvornice s nuklearnim evals sustavom, programeri: stare vještine oživljavaju

智猩猩AI整理 | 编辑:汐汐

U području AI agenata, ako ste koristili Agent Skills, sigurno ste upoznati sa skill-creator, alatom bez koda za izgradnju vještina koji je Anthropic objavio 2025. godine.

Međutim, nakon što se vještina izgradi, i dalje nije jasno je li ta vještina korisna, može li se novi model koristiti, radi li točno, kakav je učinak...

Dana 3. ožujka, Anthropicova službena blog stranica tiho je objavila značajnu nadogradnju pod nazivom Improving skill-creator: Test, measure, and refine Agent Skills. Ova nadogradnja je omogućila da Claudeova "tvornica vještina" doista postane zrela.

Od "izgleda korisno" do "testirano, mjerljivo, iterativno", potpuno je riješen najveći problem autora vještina, a to je "kako mogu znati je li vještina koju sam napravio doista korisna?"

01 - Pregled Agent Skills: ključni korak od općeg asistenta do profesionalnog agenta

U listopadu 2025. Anthropic je službeno lansirao Agent Skills, što je modularni, ponovno upotrebljivi sustav "paketa vještina". Jedna mapa sadrži SKILL.md upute, skripte, resurse, a Claude ih automatski učitava kada je potrebno, značajno poboljšavajući performanse u generiranju dokumenata, analizi podataka, usklađenosti s markama i drugim scenarijima.

Vještine su pokrile Claude.ai, Claude Code, API sve platforme, i otvorili su GitHub repozitorij (trenutno više od 80 tisuća zvjezdica). No, najveće ograničenje ranih verzija je to što su ne-tehnički korisnici mogli samo nasumično iterirati, bez mogućnosti kvantificiranja učinka.

Vještine imaju dvije vrste:

1. Povećanje sposobnosti

Stvari koje model izvorno "nije mogao" ili "nije radio stabilno" stabiliziraju se unosom specifičnih tehnika i obrazaca kroz Vještine.

2. Kodiranje preferencija

Model može raditi svaki korak, ali treba strogo slijediti određeni proces tima.

5 glavnih istaknutih točaka ove nadogradnje:

  • Evals (automatska procjena): Korisnici samo trebaju opisati "testni upit + očekivani izlaz", skill-creator automatski pokreće provjeru.
  • Benchmark način: grupno pokretanje standardiziranih testova, izlaz prolaznosti, vrijeme trajanja, potrošnja Tokena i drugi tvrdi pokazatelji.
  • Više agenata paralelno izvršava: neovisni čisti kontekst, izbjegavanje zagađenja, brzina testiranja se dramatično povećava.
  • Comparator (slijepa usporedba): A/B testiranje dviju verzija vještina.
  • Description Tuning (optimizacija opisa): automatska analiza uzoraka upita, preporučuje izmjene opisa.

02 - Nema razloga za ne instalirati! Ova nadogradnja oživljava stare vještine

Anthropicova nadogradnja skill-creator-a brzo je izazvala raspravu među AI Agent profesionalcima i programerima.

03 - CI/CD trenutak AI agenata: od umjetničkog djela do inženjerskog proizvoda

Anthropicova nadogradnja skill-creator-a u suštini je donijela najzreliji "test-standardi-iteracija" zatvoreni krug iz softverskog inženjeringa običnim korisnicima i timovima poduzeća s niskim barijerama. To znači da Agent Skills više nije "jednokratni prompt projekt" koji se "napisao i bacio", već "živi kapital" koji se može kontinuirano održavati, kompatibilan s različitim verzijama modela i optimizirati na temelju podataka.

U kratkom roku, najveći korisnici su programeri i korisnici poduzeća koji su već akumulirali brojne prilagođene vještine u Claude Code / Cowork.

Gledajući iz šire perspektive, ova nadogradnja dodatno učvršćuje Anthropicovu "alatečnu obrambenu liniju" u Agent ekosustavu.

Published in Technology

You Might Also Like