Agenti Skills: una grande innovazione! Anthropic aggiorna la fabbrica di abilità con un sistema evals di livello nucleare, sviluppatori: le vecchie abilità tornano in vita

3/9/2026
3 min read

Agenti Skills: una grande innovazione! Anthropic aggiorna la fabbrica di abilità con un sistema evals di livello nucleare, sviluppatori: le vecchie abilità tornano in vita

Intelligenza Artificiale di Zhixingxing | Editore: Xixi

Nel campo degli agenti AI, se hai mai utilizzato Agent Skills, sicuramente conoscerai skill-creator, uno strumento di costruzione di abilità senza codice rilasciato da Anthropic nel 2025.

Tuttavia, dopo aver costruito un'abilità, non si sa ancora se questa abilità sia utile, se il nuovo modello possa essere utilizzato, se funzioni correttamente e quali siano i risultati...

Il 3 marzo, il blog ufficiale di Anthropic ha silenziosamente pubblicato un aggiornamento importante intitolato "Migliorare skill-creator: Testare, misurare e affinare le abilità degli agenti". Questo aggiornamento ha portato la "fabbrica di abilità" di Claude a un livello di maturità reale.

Da "sembra funzionare" a "testabile, misurabile, iterabile", ha risolto completamente il principale problema degli autori di abilità, ovvero "le abilità che ho creato sono davvero utili?"

01 - Riflessione su Agent Skills: un passo chiave da assistente generale a agente specializzato

Nel ottobre 2025, Anthropic ha ufficialmente lanciato Agent Skills, un sistema di "pacchetti di abilità" modulare e riutilizzabile. Una cartella contiene istruzioni SKILL.md, script e risorse, che Claude carica automaticamente quando necessario, migliorando notevolmente le prestazioni in scenari come generazione di documenti, analisi dei dati e conformità del marchio.

Le abilità coprono l'intera piattaforma Claude.ai, Claude Code e API, e ha aperto un repository GitHub (attualmente con oltre 80.000 stelle). Tuttavia, la principale limitazione delle versioni iniziali era che gli utenti non tecnici potevano solo iterare in base alle sensazioni, senza poter quantificare i risultati.

Ci sono due tipi di abilità:

1. Tipo di potenziamento delle capacità

Cose che il modello non "poteva fare" o "faceva in modo instabile" vengono stabilizzate attraverso l'iniezione di tecniche e modelli specifici tramite le abilità.

2. Tipo di codifica delle preferenze

Il modello può fare ogni passo, ma deve seguire rigorosamente l'ordine specifico del team.

Cinque punti salienti di questo aggiornamento:

  • Evals (valutazione automatizzata): gli utenti devono solo descrivere "parole chiave di test + output atteso" e skill-creator esegue automaticamente la verifica.
  • Modalità Benchmark: esecuzione di test standardizzati in batch, output di tassi di successo, tempo impiegato, consumo di token e altri indicatori concreti.
  • Esecuzione parallela multi-agente: contesti indipendenti e puliti per evitare contaminazioni, velocità di test notevolmente aumentata.
  • Comparator (confronto cieco): test A/B tra due versioni di abilità.
  • Description Tuning (ottimizzazione della descrizione): analisi automatica dei suggerimenti campione, suggerendo modifiche alla descrizione.

02 - Non ci sono motivi per non installarlo! Questo aggiornamento riporta in vita le vecchie abilità

L'aggiornamento di Anthropic a skill-creator ha rapidamente suscitato dibattiti tra i professionisti e gli sviluppatori di agenti AI.

03 - Il momento CI/CD degli agenti AI: da opere d'arte a prodotti ingegneristici

L'aggiornamento di Anthropic a skill-creator è essenzialmente l'introduzione di un ciclo chiuso "test-benchmark-iterazione" già maturo nel software engineering, portato a utenti comuni e team aziendali con una barriera d'ingresso bassa. Questo significa che Agent Skills non è più un prompt usa e getta, ma un "attivo vivo" che può essere mantenuto continuamente, compatibile tra versioni di modelli e ottimizzabile attraverso i dati.

Nel breve termine, i principali beneficiari sono gli sviluppatori e gli utenti aziendali che hanno accumulato un gran numero di abilità personalizzate in Claude Code / Cowork.

Guardando a una prospettiva più ampia, questo aggiornamento rafforza ulteriormente il "muro di protezione della catena di strumenti" di Anthropic nell'ecosistema degli agenti.

Published in Technology

You Might Also Like