Agent Skills : Une Révolution Majeure ! Anthropic Met à Niveau le Skill Factory avec un Système d'Evals de Niveau Nucléaire, Développeurs : Les Anciennes Compétences Reviennent à la Vie

3/9/2026
4 min read

Agent Skills : Une Révolution Majeure ! Anthropic Met à Niveau le Skill Factory avec un Système d'Evals de Niveau Nucléaire, Développeurs : Les Anciennes Compétences Reviennent à la Vie

智猩猩AI整理 | 编辑:汐汐

Dans le domaine des agents AI, si vous avez utilisé Agent Skills, vous connaissez sûrement le skill-creator, cet outil de construction de compétences sans code publié par Anthropic en 2025.

Cependant, une fois la compétence construite, il reste impossible de savoir si cette compétence est utile, si le nouveau modèle peut encore être utilisé, si l'exécution est précise, quel est son effet...

Le 3 mars, le blog officiel d'Anthropic a discrètement publié une mise à jour majeure intitulée Improving skill-creator: Test, measure, and refine Agent Skills. Cette mise à jour a véritablement fait mûrir la "skill factory" de Claude.

Passant de "semble utilisable" à "testable, mesurable, itérable", cela a résolu complètement le plus grand point de douleur des auteurs de compétences, à savoir "la compétence que j'ai créée est-elle vraiment utile ?"

01 - Rétrospective sur Agent Skills : Une Étape Clé de l'Assistant Général au Spécialiste Intelligent

En octobre 2025, Anthropic a officiellement lancé Agent Skills, un système de "paquet de compétences" modulaire et réutilisable. Un dossier contient des instructions SKILL.md, des scripts, des ressources, que Claude charge automatiquement au besoin, améliorant considérablement les performances dans des scénarios tels que la génération de documents, l'analyse de données, la conformité de marque, etc.

Les compétences couvrent déjà Claude.ai, Claude Code, et l'ensemble de l'API, avec un dépôt GitHub ouvert (actuellement plus de 80 000 étoiles). Cependant, la plus grande limitation des premières versions était que les utilisateurs non techniques ne pouvaient itérer que sur la base de leurs impressions, sans pouvoir quantifier les résultats.

Il existe deux types de compétences :

1. Amélioration des capacités

Des tâches que le modèle "ne pouvait pas faire" ou "faisait de manière instable" peuvent être stabilisées grâce à l'injection de techniques et de modèles spécifiques via les compétences.

2. Codage des préférences

Le modèle peut effectuer chaque étape, mais doit être strictement ordonné selon le processus spécifique de l'équipe.

Cinq points forts de cette mise à jour :

  • Evals (évaluation automatisée) : L'utilisateur n'a qu'à décrire "le mot-clé de test + le résultat attendu", et le skill-creator exécute automatiquement la validation.
  • Mode Benchmark : Exécute des tests standardisés en masse, produisant des indicateurs durs tels que le taux de réussite, le temps d'exécution, la consommation de tokens, etc.
  • Exécution parallèle multi-agents : Contexte propre et indépendant, évitant la pollution, vitesse de test considérablement augmentée.
  • Comparator (comparaison à l'aveugle) : Test A/B de deux versions de compétences.
  • Description Tuning (optimisation de la description déclenchée) : Analyse automatique des échantillons de prompt, suggestions de modifications de description.

02 - Aucune raison de ne pas installer ! Cette mise à jour fait revivre les anciennes compétences

La mise à jour d'Anthropic pour le skill-creator a rapidement suscité des discussions animées parmi les professionnels et développeurs d'agents AI.

03 - Le moment CI/CD des agents AI : De l'œuvre d'art au produit d'ingénierie

La mise à niveau d'Anthropic pour le skill-creator est essentiellement l'introduction d'un cycle fermé "test-benchmark-itération" le plus mature du génie logiciel, accessible aux utilisateurs ordinaires et aux équipes d'entreprise. Cela signifie que les Agent Skills ne sont plus un prompt jetable "écrit et oublié", mais un "actif vivant" pouvant être maintenu en continu, compatible entre les versions de modèles, et optimisé de manière data-driven.

À court terme, les plus grands bénéficiaires sont les développeurs et utilisateurs d'entreprise qui ont déjà accumulé de nombreuses compétences personnalisées dans Claude Code / Cowork.

D'un point de vue plus macro, cette mise à jour renforce encore la "chaîne d'outils" d'Anthropic dans l'écosystème des agents.

Published in Technology

You Might Also Like