Aģenta prasmju nozīmīgas inovācijas! Anthropic uzlabo prasmju fabriku, iekļaujot kodolieroča līmeņa evals sistēmu, izstrādātāji: vecās prasmes atdzimst

Inteliģentā AI apkopojums | Redaktors: Xi Xi

AI aģentu jomā, ja esat izmantojis Aģenta prasmes, tad noteikti zināt par skill-creator, šo bezkoda rīku, ko Anthropic izlaida 2025. gadā.

Tomēr, pēc prasmju izveides, joprojām nav skaidrs, vai šī prasme ir noderīga, vai jauni modeļi joprojām ir izmantojami, vai tie darbojas precīzi, kādi ir rezultāti...

martā Anthropic oficiālajā emuārā klusi tika publicēts svarīgs atjauninājums, kas saucas "Improving skill-creator: Test, measure, and refine Agent Skills". Šis atjauninājums ļāva Claude "prasmju fabrikai" patiešām nobriest.

No "izskatās, ka var izmantot" līdz "testējams, izmērāms, iterējams", tas pilnībā atrisināja iepriekšējo prasmju autoru lielāko problēmu, proti, "vai mana izveidotā prasme ir tiešām noderīga?"

01 - Aģenta prasmju pārskats: no vispārēja asistenta uz profesionālu aģentu būtiskais solis

gada oktobrī Anthropic oficiāli izlaida Aģenta prasmes, kas ir modulāra, atkārtoti izmantojama "prasmju pakotņu" sistēma. Vienā mapē ir iekļauti SKILL.md norādījumi, skripti, resursi, ko Claude automātiski ielādē, kad nepieciešams, būtiski uzlabojot dokumentu ģenerēšanu, datu analīzi, zīmola atbilstību un citus scenārijus.

Prasmes ir pieejamas visās platformās: Claude.ai, Claude Code, API, un ir atvērts GitHub repozitorijs (pašlaik ar vairāk nekā 80 000 zvaigznēm). Tomēr agrīno versiju lielākā ierobežojuma ir tas, ka tehniskie lietotāji varēja tikai paļauties uz sajūtām, lai veiktu iterācijas, nespējot kvantitatīvi pārbaudīt efektivitāti.

Prasmēm ir divi veidi:

1. Spēju uzlabošanas veids

Modeļa sākotnēji "nevarēja" vai "darbojās nestabili" lietas, izmantojot Prasmes, tiek ieviesti specifiski paņēmieni, lai stabilizētu rezultātus.

2. Preferenču kodēšanas veids

Modelis katrā solī var darīt, bet ir jāievēro komandas specifiskā procesa stingra secība.

Šī atjauninājuma 5 galvenie punkti:

Evals (automātiskā novērtēšana): lietotājiem tikai jāapraksta "testēšanas norādījums + gaidāmā iznākuma izskats", skill-creator automātiski veic pārbaudi.
Benchmark režīms: masveida standarta testu veikšana, iznākuma caurlaides koeficients, laika patēriņš, Token patēriņš un citi cietie rādītāji.
Daudzu aģentu paralēla izpilde: neatkarīga tīra konteksta, lai izvairītos no piesārņojuma, testēšanas ātrums ievērojami palielinās.
Comparator (aklās salīdzināšanas tests): A/B testēšana diviem prasmju variantiem.
Description Tuning (izsistīšanas apraksta optimizācija): automātiska paraugu norādījumu analīze, ieteikumi apraksta labojumiem.

02 - Nav iemesla neinstalēt! Šis atjauninājums ļauj vecajām prasmēm atdzimt

Anthropic šis atjauninājums skill-creator ātri izraisīja diskusijas starp AI aģentu speciālistiem un izstrādātājiem.

03 - AI aģentu CI/CD brīdis: no mākslas darbiem uz inženierijas produktiem

Anthropic šis skill-creator atjauninājums būtībā ir ņēmis visattīstītāko "testēšanas-benchmarks-iterācijas" slēgto ciklu no programmatūras inženierijas un zemu slieksni to piedāvājis parastajiem lietotājiem un uzņēmumu komandām. Tas nozīmē, ka Aģenta prasmes vairs nav "uzrakstītas un izmestas" vienreizējas prompt inženierijas, bet gan var pastāvīgi uzturēt, būt saderīgas ar dažādiem modeļu variantiem un optimizēt datu veidā "dzīvas aktīvas".

Īstermiņā lielākais ieguvējs ir izstrādātāji un uzņēmumu lietotāji, kuri jau ir uzkrājuši daudz pielāgotu prasmju Claude Code / Cowork.

Un, raugoties plašākā perspektīvā, šis atjauninājums vēl vairāk nostiprināja Anthropic "rīku ķēdes aizsardzības grāvi" Aģenta ekosistēmā.

Aģenta prasmju nozīmīgas inovācijas! Anthropic uzlabo prasmju fabriku, iekļaujot kodolieroča līmeņa evals sistēmu, izstrādātāji: vecās prasmes atdzimst

Aģenta prasmju nozīmīgas inovācijas! Anthropic uzlabo prasmju fabriku, iekļaujot kodolieroča līmeņa evals sistēmu, izstrādātāji: vecās prasmes atdzimst

01 - Aģenta prasmju pārskats: no vispārēja asistenta uz profesionālu aģentu būtiskais solis

Prasmēm ir divi veidi:

1. Spēju uzlabošanas veids

2. Preferenču kodēšanas veids

Šī atjauninājuma 5 galvenie punkti:

02 - Nav iemesla neinstalēt! Šis atjauninājums ļauj vecajām prasmēm atdzimt

03 - AI aģentu CI/CD brīdis: no mākslas darbiem uz inženierijas produktiem

You Might Also Like

Claude Code Buddy modificēšanas ceļvedis: kā iegūt spīdīgu leģendāro mājdzīvnieku

Obsidian ir izlaidusi Defuddle, pacelot Obsidian Web Clipper uz jauniem augstumiem

OpenAI pēkšņi paziņo par "trīs vienā": pārlūks + programmēšana + ChatGPT apvienošana, iekšēji atzīst, ka pagājušajā gadā tika pieļautas kļūdas

2026, vairs neuzspied sevi "pašdisciplīnai"! Veic šos 8 sīkumus, veselība nāks dabiski

Māmiņas, kas cenšas zaudēt svaru, bet nesasniedz rezultātus, noteikti ir šeit

AI Pārlūka 24 stundu stabilas darbības ceļvedis