Agent Skills重大革新!Anthropic升级技能工厂塞进核弹级evals系统,开发者:旧技能起死回生

3/9/2026
3 min read

Agent Skills重大革新!Anthropic升级技能工厂塞进核弹级evals系统,开发者:旧技能起死回生

智猩猩AI整理 | 编辑:汐汐

U oblasti AI agenata, ako ste koristili Agent Skills, sigurno ste čuli za skill-creator, alat za izgradnju veština bez koda koji je Anthropic objavio 2025. godine.

Međutim, nakon što se veština izgradi, i dalje nije jasno da li je ta veština korisna, da li se novi modeli mogu koristiti, da li radi tačno, kakvi su rezultati...

Dana 3. marta, zvanični blog Anthropic-a tiho je objavio značajnu nadogradnju pod nazivom Improving skill-creator: Test, measure, and refine Agent Skills. Ova nadogradnja je omogućila da Claude-ova "fabrika veština" zaista postane zrela.

Od "izgleda korisno" do "testirano, merljivo, iterativno", ovo je potpuno rešilo najveći problem autora veština, a to je "kako da znam da li je veština koju sam napravio zaista korisna?"

01 - Agent Skills pregled: ključni korak od opšteg asistenta do profesionalnog agenta

U oktobru 2025. godine, Anthropic je zvanično lansirao Agent Skills, što je modularni, ponovo upotrebljiv sistem "paketa veština". Jedan folder sadrži SKILL.md instrukcije, skripte, resurse, a Claude automatski učitava kada je potrebno, značajno poboljšavajući performanse u generisanju dokumenata, analizi podataka, usklađenosti brenda i drugim scenarijima.

Veštine su pokrile Claude.ai, Claude Code, API sve platforme, i otvorile GitHub repozitorij (trenutno sa više od 80.000 zvezdica). Međutim, najveće ograničenje ranih verzija je to što su ne-tehnički korisnici mogli da iteriraju samo na osnovu osećaja, bez mogućnosti kvantifikacije rezultata.

Veštine imaju dve vrste:

1. Povećanje sposobnosti

Stvari koje model izvorno "nije mogao" ili "nije radio stabilno" se stabilizuju kroz Skills unošenjem specifičnih trikova i obrazaca.

2. Kodiranje preferencija

Model može da uradi svaki korak, ali je potrebno strogo sortirati prema specifičnom procesu tima.

Ova nadogradnja ima 5 glavnih karakteristika:

  • Evals (automatska procena): Korisnici samo treba da opišu "testni prompt + očekivani izlaz", skill-creator automatski pokreće verifikaciju.
  • Benchmark mod: Grupno pokretanje standardizovanih testova, izlaz sa stopom prolaznosti, vremenom trajanja, potrošnjom Token-a i drugim tvrdim metrikama.
  • Paralelno izvršavanje više agenata: Nezavisni čisti kontekst, izbegavanje zagađenja, brzina testiranja se drastično povećava.
  • Comparator (slepo testiranje): A/B testiranje dve verzije veštine.
  • Description Tuning (optimizacija opisa): Automatska analiza uzoraka prompta, preporuke za izmene opisa.

02 - Nema razloga da se ne instalira! Ova nadogradnja vraća stare veštine u život

Anthropic-ova nadogradnja skill-creator-a brzo je izazvala raspravu među AI Agent profesionalcima i developerima.

03 - CI/CD trenutak AI agenata: od umetničkog dela do inženjerskog proizvoda

Anthropic-ova nadogradnja skill-creator-a suštinski je donela najzreliji "test-standarde-iteracije" krug softverskog inženjeringa običnim korisnicima i timovima preduzeća sa niskim barijerama. To znači da Agent Skills više nisu "jednokratni prompt" koji se piše i baca, već "živi resurs" koji se može kontinuirano održavati, kompatibilan između verzija modela i optimizovan na osnovu podataka.

U kratkom roku, najveći korisnici su developeri i preduzeća koja su već akumulirala veliki broj prilagođenih veština u Claude Code / Cowork.

Gledajući iz šire perspektive, ova nadogradnja dodatno učvršćuje "alate" kao zaštitni pojas Anthropic-a u Agent ekosistemu.

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy модификација: Како добити сјајног легендарног љубимца

Claude Code Buddy модификација: Како добити сјајног легендарног љубимца априла 2026. године, Anthropic је у верзији Clau...

Obsidian je lansirao Defuddle, podigao Obsidian Web Clipper na novi nivoTechnology

Obsidian je lansirao Defuddle, podigao Obsidian Web Clipper na novi nivo

Obsidian je lansirao Defuddle, podigao Obsidian Web Clipper na novi nivo Uvek sam voleo osnovnu ideju Obsidiana: lokaln...

OpenAI iznenada najavljuje "tri u jednom": spajanje pretraživača + programiranja + ChatGPT, unutrašnje priznanje da su prošle godine pogrešiliTechnology

OpenAI iznenada najavljuje "tri u jednom": spajanje pretraživača + programiranja + ChatGPT, unutrašnje priznanje da su prošle godine pogrešili

OpenAI iznenada najavljuje "tri u jednom": spajanje pretraživača + programiranja + ChatGPT, unutrašnje priznanje da su p...

2026, ne prisiljavajte se na "disciplinu"! Uradite ovih 8 malih stvari, zdravlje će doći prirodnoHealth

2026, ne prisiljavajte se na "disciplinu"! Uradite ovih 8 malih stvari, zdravlje će doći prirodno

2026, ne prisiljavajte se na "disciplinu"! Uradite ovih 8 malih stvari, zdravlje će doći prirodno Nova godina je počela...

One of the reasons why mothers who work hard to lose weight can't succeed is definitely hereHealth

One of the reasons why mothers who work hard to lose weight can't succeed is definitely here

One of the reasons why mothers who work hard to lose weight can't succeed is definitely here Mart je već prošao, kako n...

📝
Technology

AI Browser 24-сатна стабилна операција

AI Browser 24-сатна стабилна операција Овај водич описује како да се подеси стабилно, дугорочно окружење за AI прегледач...