Afacerea Agent Skills: O revoluție majoră! Anthropic îmbunătățește fabrica de abilități cu un sistem evals de nivel nuclear, dezvoltatori: abilitățile vechi revin la viață

3/9/2026
3 min read

Afacerea Agent Skills: O revoluție majoră! Anthropic îmbunătățește fabrica de abilități cu un sistem evals de nivel nuclear, dezvoltatori: abilitățile vechi revin la viață

智猩猩AI整理 | 编辑:汐汐

În domeniul agenților AI, dacă ați folosit vreodată Agent Skills, cu siguranță cunoașteți skill-creator, un instrument de construire a abilităților fără cod, lansat de Anthropic în 2025.

Dar după ce ați construit o abilitate, tot nu știți dacă această abilitate este utilă, dacă noul model mai funcționează, dacă rulează corect, cum este eficiența...

Pe 3 martie, blogul oficial Anthropic a publicat discret o actualizare importantă, numită Improving skill-creator: Test, measure, and refine Agent Skills. Această actualizare a făcut ca "fabrica de abilități" a lui Claude să devină cu adevărat matură.

De la "pare că funcționează" la "testabil, măsurabil, iterabil", s-a rezolvat complet cea mai mare durere a autorilor de abilități, și anume "cât de bine funcționează abilitățile pe care le-am creat?"

01 - Recapitulare Agent Skills: un pas cheie de la asistent general la agent inteligent specializat

În octombrie 2025, Anthropic a lansat oficial Agent Skills, un sistem modular și reutilizabil de "pachete de abilități". Un folder conține instrucțiuni SKILL.md, scripturi, resurse, iar Claude le încarcă automat atunci când este necesar, îmbunătățind semnificativ performanța în generarea documentelor, analiza datelor, conformitatea de brand etc.

Abilitățile sunt disponibile pe toate platformele Claude.ai, Claude Code, API și au deschis un depozit GitHub (în prezent cu peste 80.000 de stele). Dar cea mai mare limitare a versiunilor timpurii a fost că utilizatorii non-tehnici puteau doar să itereze pe baza intuiției, fără a putea cuantifica efectele.

Există două tipuri de abilități:

1. Tipul de îmbunătățire a capacității

Lucruri pe care modelul nu le putea "face" sau le făcea "instabil", prin Abilități se injectează tehnici și modele specifice pentru a stabiliza output-ul.

2. Tipul de codificare a preferințelor

Modelul poate face fiecare pas, dar trebuie să fie ordonat strict conform procesului specific al echipei.

Cele 5 puncte forte ale acestei actualizări:

  • Evals (evaluare automată): utilizatorii trebuie doar să descrie "test prompt + aspectul așteptat al output-ului" skill-creator rulează automat validarea.
  • Mod de benchmark: rulează teste standardizate în loturi, oferind rate de succes, timp de execuție, consum de token-uri și alte indicatori duri.
  • Execuție paralelă multi-agent: context curat și independent, evitând contaminarea, viteza de testare crește exponențial.
  • Comparator (comparare în orb): teste A/B pentru două versiuni ale abilității.
  • Description Tuning (optimizarea descrierii de activare): analizează automat exemplele de prompturi și sugerează modificări ale descrierii.

02 - Nu există motive să nu instalați! Această actualizare readuce la viață abilitățile vechi

Actualizarea Anthropic pentru skill-creator a stârnit rapid discuții intense în rândul practicienilor și dezvoltatorilor de agenți AI.

03 - Momentul CI/CD pentru agenții AI: de la opere de artă la produse inginerie

Îmbunătățirea Anthropic a skill-creator este, în esență, aducerea celei mai mature seturi de "testare - benchmark - iterație" din ingineria software la utilizatorii obișnuiți și echipele de afaceri, cu un prag de accesibilitate scăzut. Aceasta înseamnă că Agent Skills nu mai sunt un prompt de o singură utilizare, ci un "activ viu" care poate fi întreținut continuu, compatibil între versiunile modelului și optimizat pe baza datelor.

Pe termen scurt, cei mai mari beneficiari sunt dezvoltatorii și utilizatorii de afaceri care au acumulat deja o mulțime de abilități personalizate în Claude Code / Cowork.

Privind dintr-o perspectivă mai macro, această actualizare întărește și mai mult "fosa de apărare a lanțului de instrumente" a Anthropic în ecosistemul Agent.

Published in Technology

You Might Also Like