Agent Skills značajna inovacija! Anthropic nadogradnja vještina tvornice s nuklearnim evals sustavom, programeri: stare vještine oživljavaju

智猩猩AI整理 | 编辑：汐汐

U području AI agenata, ako ste koristili Agent Skills, sigurno ste upoznati sa skill-creator, alatom bez koda za izgradnju vještina koji je Anthropic objavio 2025. godine.

Međutim, nakon što se vještina izgradi, i dalje nije jasno je li ta vještina korisna, može li se novi model koristiti, radi li točno, kakav je učinak...

Dana 3. ožujka, Anthropicova službena blog stranica tiho je objavila značajnu nadogradnju pod nazivom Improving skill-creator: Test, measure, and refine Agent Skills. Ova nadogradnja je omogućila da Claudeova "tvornica vještina" doista postane zrela.

Od "izgleda korisno" do "testirano, mjerljivo, iterativno", potpuno je riješen najveći problem autora vještina, a to je "kako mogu znati je li vještina koju sam napravio doista korisna?"

01 - Pregled Agent Skills: ključni korak od općeg asistenta do profesionalnog agenta

U listopadu 2025. Anthropic je službeno lansirao Agent Skills, što je modularni, ponovno upotrebljivi sustav "paketa vještina". Jedna mapa sadrži SKILL.md upute, skripte, resurse, a Claude ih automatski učitava kada je potrebno, značajno poboljšavajući performanse u generiranju dokumenata, analizi podataka, usklađenosti s markama i drugim scenarijima.

Vještine su pokrile Claude.ai, Claude Code, API sve platforme, i otvorili su GitHub repozitorij (trenutno više od 80 tisuća zvjezdica). No, najveće ograničenje ranih verzija je to što su ne-tehnički korisnici mogli samo nasumično iterirati, bez mogućnosti kvantificiranja učinka.

Vještine imaju dvije vrste:

1. Povećanje sposobnosti

Stvari koje model izvorno "nije mogao" ili "nije radio stabilno" stabiliziraju se unosom specifičnih tehnika i obrazaca kroz Vještine.

2. Kodiranje preferencija

Model može raditi svaki korak, ali treba strogo slijediti određeni proces tima.

5 glavnih istaknutih točaka ove nadogradnje:

Evals (automatska procjena): Korisnici samo trebaju opisati "testni upit + očekivani izlaz", skill-creator automatski pokreće provjeru.
Benchmark način: grupno pokretanje standardiziranih testova, izlaz prolaznosti, vrijeme trajanja, potrošnja Tokena i drugi tvrdi pokazatelji.
Više agenata paralelno izvršava: neovisni čisti kontekst, izbjegavanje zagađenja, brzina testiranja se dramatično povećava.
Comparator (slijepa usporedba): A/B testiranje dviju verzija vještina.
Description Tuning (optimizacija opisa): automatska analiza uzoraka upita, preporučuje izmjene opisa.

02 - Nema razloga za ne instalirati! Ova nadogradnja oživljava stare vještine

Anthropicova nadogradnja skill-creator-a brzo je izazvala raspravu među AI Agent profesionalcima i programerima.

03 - CI/CD trenutak AI agenata: od umjetničkog djela do inženjerskog proizvoda

Anthropicova nadogradnja skill-creator-a u suštini je donijela najzreliji "test-standardi-iteracija" zatvoreni krug iz softverskog inženjeringa običnim korisnicima i timovima poduzeća s niskim barijerama. To znači da Agent Skills više nije "jednokratni prompt projekt" koji se "napisao i bacio", već "živi kapital" koji se može kontinuirano održavati, kompatibilan s različitim verzijama modela i optimizirati na temelju podataka.

U kratkom roku, najveći korisnici su programeri i korisnici poduzeća koji su već akumulirali brojne prilagođene vještine u Claude Code / Cowork.

Gledajući iz šire perspektive, ova nadogradnja dodatno učvršćuje Anthropicovu "alatečnu obrambenu liniju" u Agent ekosustavu.

Agent Skills značajna inovacija! Anthropic nadogradnja vještina tvornice s nuklearnim evals sustavom, programeri: stare vještine oživljavaju

Agent Skills značajna inovacija! Anthropic nadogradnja vještina tvornice s nuklearnim evals sustavom, programeri: stare vještine oživljavaju

01 - Pregled Agent Skills: ključni korak od općeg asistenta do profesionalnog agenta

Vještine imaju dvije vrste:

1. Povećanje sposobnosti

2. Kodiranje preferencija

5 glavnih istaknutih točaka ove nadogradnje:

02 - Nema razloga za ne instalirati! Ova nadogradnja oživljava stare vještine

03 - CI/CD trenutak AI agenata: od umjetničkog djela do inženjerskog proizvoda

You Might Also Like

Claude Code Buddy izmjena vodič: kako dobiti sjajnog legendarno ljubimca

Obsidian je lansirao Defuddle, podižući Obsidian Web Clipper na novu razinu

OpenAI iznenada najavljuje "tri u jednom": spajanje preglednika + programiranja + ChatGPT, unutarnje priznanje da su prošlu godinu pogriješili

2026, ne prisiljavajte se na "disciplinu"! Učinite ovih 8 malih stvari, zdravlje će doći prirodno

One effortful mothers who can't lose weight definitely fall here

AI Browser 24-satna stabilna operativna uputa