Aģenta prasmju nozīmīgas inovācijas! Anthropic uzlabo prasmju fabriku, iekļaujot kodolieroča līmeņa evals sistēmu, izstrādātāji: vecās prasmes atdzimst
Aģenta prasmju nozīmīgas inovācijas! Anthropic uzlabo prasmju fabriku, iekļaujot kodolieroča līmeņa evals sistēmu, izstrādātāji: vecās prasmes atdzimst
Inteliģentā AI apkopojums | Redaktors: Xi Xi
AI aģentu jomā, ja esat izmantojis Aģenta prasmes, tad noteikti zināt par skill-creator, šo bezkoda rīku, ko Anthropic izlaida 2025. gadā.
Tomēr, pēc prasmju izveides, joprojām nav skaidrs, vai šī prasme ir noderīga, vai jauni modeļi joprojām ir izmantojami, vai tie darbojas precīzi, kādi ir rezultāti...
No "izskatās, ka var izmantot" līdz "testējams, izmērāms, iterējams", tas pilnībā atrisināja iepriekšējo prasmju autoru lielāko problēmu, proti, "vai mana izveidotā prasme ir tiešām noderīga?"
01 - Aģenta prasmju pārskats: no vispārēja asistenta uz profesionālu aģentu būtiskais solis
Prasmes ir pieejamas visās platformās: Claude.ai, Claude Code, API, un ir atvērts GitHub repozitorijs (pašlaik ar vairāk nekā 80 000 zvaigznēm). Tomēr agrīno versiju lielākā ierobežojuma ir tas, ka tehniskie lietotāji varēja tikai paļauties uz sajūtām, lai veiktu iterācijas, nespējot kvantitatīvi pārbaudīt efektivitāti.
Prasmēm ir divi veidi:
1. Spēju uzlabošanas veids
Modeļa sākotnēji "nevarēja" vai "darbojās nestabili" lietas, izmantojot Prasmes, tiek ieviesti specifiski paņēmieni, lai stabilizētu rezultātus.
2. Preferenču kodēšanas veids
Modelis katrā solī var darīt, bet ir jāievēro komandas specifiskā procesa stingra secība.
Šī atjauninājuma 5 galvenie punkti:
- Evals (automātiskā novērtēšana): lietotājiem tikai jāapraksta "testēšanas norādījums + gaidāmā iznākuma izskats", skill-creator automātiski veic pārbaudi.
- Benchmark režīms: masveida standarta testu veikšana, iznākuma caurlaides koeficients, laika patēriņš, Token patēriņš un citi cietie rādītāji.
- Daudzu aģentu paralēla izpilde: neatkarīga tīra konteksta, lai izvairītos no piesārņojuma, testēšanas ātrums ievērojami palielinās.
- Comparator (aklās salīdzināšanas tests): A/B testēšana diviem prasmju variantiem.
- Description Tuning (izsistīšanas apraksta optimizācija): automātiska paraugu norādījumu analīze, ieteikumi apraksta labojumiem.
02 - Nav iemesla neinstalēt! Šis atjauninājums ļauj vecajām prasmēm atdzimt
Anthropic šis atjauninājums skill-creator ātri izraisīja diskusijas starp AI aģentu speciālistiem un izstrādātājiem.
03 - AI aģentu CI/CD brīdis: no mākslas darbiem uz inženierijas produktiem
Anthropic šis skill-creator atjauninājums būtībā ir ņēmis visattīstītāko "testēšanas-benchmarks-iterācijas" slēgto ciklu no programmatūras inženierijas un zemu slieksni to piedāvājis parastajiem lietotājiem un uzņēmumu komandām. Tas nozīmē, ka Aģenta prasmes vairs nav "uzrakstītas un izmestas" vienreizējas prompt inženierijas, bet gan var pastāvīgi uzturēt, būt saderīgas ar dažādiem modeļu variantiem un optimizēt datu veidā "dzīvas aktīvas".
Īstermiņā lielākais ieguvējs ir izstrādātāji un uzņēmumu lietotāji, kuri jau ir uzkrājuši daudz pielāgotu prasmju Claude Code / Cowork.
Un, raugoties plašākā perspektīvā, šis atjauninājums vēl vairāk nostiprināja Anthropic "rīku ķēdes aizsardzības grāvi" Aģenta ekosistēmā.

