Agent Skills grote innovatie! Anthropic upgradeert skill factory met nucleaire evals systeem, ontwikkelaars: oude vaardigheden herleven

3/9/2026
3 min read

Agent Skills grote innovatie! Anthropic upgradeert skill factory met nucleaire evals systeem, ontwikkelaars: oude vaardigheden herleven

智猩猩AI整理 | 编辑:汐汐

In het domein van AI-agenten, als je ooit gebruik hebt gemaakt van Agent Skills, dan ben je zeker bekend met skill-creator, een door Anthropic in 2025 uitgebracht no-code bouwtool voor vaardigheden.

Maar na het bouwen van een skill, is het nog steeds onduidelijk of deze skill nuttig is, of het nieuwe model nog bruikbaar is, of het nauwkeurig draait, en hoe de effectiviteit is...

Op 3 maart heeft de officiële blog van Anthropic stilletjes een belangrijke update gepubliceerd, genaamd Improving skill-creator: Test, measure, and refine Agent Skills. Deze upgrade heeft ervoor gezorgd dat Claude's "skill factory" echt volwassen is geworden.

Van "het lijkt bruikbaar" naar "testbaar, meetbaar, en iteratief", dit loste volledig het grootste pijnpunt van eerdere skill-auteurs op, namelijk "is de skill die ik heb gemaakt eigenlijk nuttig?"

01 - Terugblik op Agent Skills: een cruciale stap van algemene assistent naar professionele agent

In oktober 2025 lanceerde Anthropic officieel Agent Skills, een modulair en herbruikbaar "skill package" systeem. Een map bevat SKILL.md instructies, scripts, en bronnen, die Claude automatisch laadt wanneer nodig, wat de prestaties in documentgeneratie, data-analyse, merkcompliance en andere scenario's aanzienlijk verbetert.

Skills zijn beschikbaar op het volledige Claude.ai, Claude Code, en API-platform, en de GitHub-repository is geopend (momenteel meer dan 80.000 sterren). Maar de grootste beperking van de vroege versies was dat niet-technische gebruikers alleen op gevoel konden itereren, zonder de effectiviteit te kunnen kwantificeren.

Er zijn twee soorten Skills:

1. Vermogensverbetering

Dingen die het model oorspronkelijk "niet kon" of "onbetrouwbaar" deed, kunnen door Skills specifieke technieken en patronen te injecteren, stabieler worden uitgevoerd.

2. Voorkeur codering

Het model kan elke stap uitvoeren, maar moet strikt volgens het specifieke proces van het team worden gerangschikt.

Vijf hoogtepunten van deze upgrade:

  • Evals (geautomatiseerde evaluatie): gebruikers hoeven alleen maar "test prompt + verwachte output" te beschrijven, skill-creator voert automatisch de validatie uit.
  • Benchmark modus: batchgewijze uitvoering van gestandaardiseerde tests, output van doorvoerpercentages, tijdsduur, Token verbruik en andere harde indicatoren.
  • Meerdere agenten parallel uitvoeren: onafhankelijke schone context, voorkomt vervuiling, test snelheid neemt enorm toe.
  • Comparator (blinde testvergelijking): A/B-test van twee versies van skills.
  • Description Tuning (trigger beschrijving optimalisatie): automatisch analyseren van voorbeeld prompts, aanbevelingen voor beschrijvingswijzigingen.

02 - Geen reden om niet te installeren! Deze update laat oude skills herleven

De update van Anthropic voor skill-creator heeft snel een levendige discussie op gang gebracht onder AI-agenten professionals en ontwikkelaars.

03 - Het CI/CD-moment van AI-agenten: van kunstwerk naar engineeringproduct

De upgrade van Anthropic voor skill-creator is in wezen het brengen van de meest volwassen "test-benchmark-iteratie" gesloten lus uit de software-engineering naar gewone gebruikers en bedrijfsteams met een lage drempel. Dit betekent dat Agent Skills niet langer een eenmalige prompt-engineering is die "af is en weggooit", maar een "levend actief" dat continu kan worden onderhouden, compatibel is tussen modelversies, en geoptimaliseerd kan worden met data.

Op korte termijn zijn de grootste begunstigden de ontwikkelaars en bedrijfsgebruikers die al een groot aantal aangepaste vaardigheden hebben opgebouwd in Claude Code / Cowork.

Vanuit een breder perspectief verstevigt deze update verder de "toolchain moat" van Anthropic in het Agent-ecosysteem.

Published in Technology

You Might Also Like