Aģenta prasmju nozīmīgas inovācijas! Anthropic uzlabo prasmju fabriku, iekļaujot kodolieroča līmeņa evals sistēmu, izstrādātāji: vecās prasmes atdzimst

3/9/2026
3 min read

Aģenta prasmju nozīmīgas inovācijas! Anthropic uzlabo prasmju fabriku, iekļaujot kodolieroča līmeņa evals sistēmu, izstrādātāji: vecās prasmes atdzimst

Inteliģentā AI apkopojums | Redaktors: Xi Xi

AI aģentu jomā, ja esat izmantojis Aģenta prasmes, tad noteikti zināt par skill-creator, šo bezkoda rīku, ko Anthropic izlaida 2025. gadā.

Tomēr, pēc prasmju izveides, joprojām nav skaidrs, vai šī prasme ir noderīga, vai jauni modeļi joprojām ir izmantojami, vai tie darbojas precīzi, kādi ir rezultāti...

  • martā Anthropic oficiālajā emuārā klusi tika publicēts svarīgs atjauninājums, kas saucas "Improving skill-creator: Test, measure, and refine Agent Skills". Šis atjauninājums ļāva Claude "prasmju fabrikai" patiešām nobriest.
  • No "izskatās, ka var izmantot" līdz "testējams, izmērāms, iterējams", tas pilnībā atrisināja iepriekšējo prasmju autoru lielāko problēmu, proti, "vai mana izveidotā prasme ir tiešām noderīga?"

    01 - Aģenta prasmju pārskats: no vispārēja asistenta uz profesionālu aģentu būtiskais solis

  • gada oktobrī Anthropic oficiāli izlaida Aģenta prasmes, kas ir modulāra, atkārtoti izmantojama "prasmju pakotņu" sistēma. Vienā mapē ir iekļauti SKILL.md norādījumi, skripti, resursi, ko Claude automātiski ielādē, kad nepieciešams, būtiski uzlabojot dokumentu ģenerēšanu, datu analīzi, zīmola atbilstību un citus scenārijus.
  • Prasmes ir pieejamas visās platformās: Claude.ai, Claude Code, API, un ir atvērts GitHub repozitorijs (pašlaik ar vairāk nekā 80 000 zvaigznēm). Tomēr agrīno versiju lielākā ierobežojuma ir tas, ka tehniskie lietotāji varēja tikai paļauties uz sajūtām, lai veiktu iterācijas, nespējot kvantitatīvi pārbaudīt efektivitāti.

    Prasmēm ir divi veidi:

    1. Spēju uzlabošanas veids

    Modeļa sākotnēji "nevarēja" vai "darbojās nestabili" lietas, izmantojot Prasmes, tiek ieviesti specifiski paņēmieni, lai stabilizētu rezultātus.

    2. Preferenču kodēšanas veids

    Modelis katrā solī var darīt, bet ir jāievēro komandas specifiskā procesa stingra secība.

    Šī atjauninājuma 5 galvenie punkti:

    • Evals (automātiskā novērtēšana): lietotājiem tikai jāapraksta "testēšanas norādījums + gaidāmā iznākuma izskats", skill-creator automātiski veic pārbaudi.
    • Benchmark režīms: masveida standarta testu veikšana, iznākuma caurlaides koeficients, laika patēriņš, Token patēriņš un citi cietie rādītāji.
    • Daudzu aģentu paralēla izpilde: neatkarīga tīra konteksta, lai izvairītos no piesārņojuma, testēšanas ātrums ievērojami palielinās.
    • Comparator (aklās salīdzināšanas tests): A/B testēšana diviem prasmju variantiem.
    • Description Tuning (izsistīšanas apraksta optimizācija): automātiska paraugu norādījumu analīze, ieteikumi apraksta labojumiem.

    02 - Nav iemesla neinstalēt! Šis atjauninājums ļauj vecajām prasmēm atdzimt

    Anthropic šis atjauninājums skill-creator ātri izraisīja diskusijas starp AI aģentu speciālistiem un izstrādātājiem.

    03 - AI aģentu CI/CD brīdis: no mākslas darbiem uz inženierijas produktiem

    Anthropic šis skill-creator atjauninājums būtībā ir ņēmis visattīstītāko "testēšanas-benchmarks-iterācijas" slēgto ciklu no programmatūras inženierijas un zemu slieksni to piedāvājis parastajiem lietotājiem un uzņēmumu komandām. Tas nozīmē, ka Aģenta prasmes vairs nav "uzrakstītas un izmestas" vienreizējas prompt inženierijas, bet gan var pastāvīgi uzturēt, būt saderīgas ar dažādiem modeļu variantiem un optimizēt datu veidā "dzīvas aktīvas".

    Īstermiņā lielākais ieguvējs ir izstrādātāji un uzņēmumu lietotāji, kuri jau ir uzkrājuši daudz pielāgotu prasmju Claude Code / Cowork.

    Un, raugoties plašākā perspektīvā, šis atjauninājums vēl vairāk nostiprināja Anthropic "rīku ķēdes aizsardzības grāvi" Aģenta ekosistēmā.

    Published in Technology

    You Might Also Like