Agente Skills: Grande Inovação! Anthropic Atualiza a Fábrica de Habilidades com um Sistema de Evals de Nível Nuclear, Desenvolvedores: Habilidades Antigas Revivem

3/9/2026
3 min read

Agente Skills: Grande Inovação! Anthropic Atualiza a Fábrica de Habilidades com um Sistema de Evals de Nível Nuclear, Desenvolvedores: Habilidades Antigas Revivem

智猩猩AI整理 | 编辑:汐汐

No campo dos agentes de IA, se você já usou o Agent Skills, com certeza conhece o skill-creator, uma ferramenta de construção de skills sem código lançada pela Anthropic em 2025.

No entanto, após construir uma skill, ainda não se sabe se essa skill é útil, se o novo modelo ainda pode ser usado, se está funcionando corretamente, como está o desempenho...

No dia 3 de março, o blog oficial da Anthropic lançou discretamente uma atualização importante, chamada Improving skill-creator: Test, measure, and refine Agent Skills. Esta atualização fez com que a "fábrica de habilidades" do Claude realmente amadurecesse.

De "parece que funciona" para "testável, mensurável, iterável", resolveu completamente a maior dor de cabeça dos autores de skills anteriores, que é "a skill que eu fiz realmente funciona bem?"

01 - Revisão do Agent Skills: Um Passo Crucial de Assistente Geral para Agente Especializado

Em outubro de 2025, a Anthropic lançou oficialmente o Agent Skills, que é um sistema de "pacotes de habilidades" modular e reutilizável. Uma pasta contém instruções SKILL.md, scripts e recursos, que o Claude carrega automaticamente quando necessário, melhorando significativamente o desempenho em geração de documentos, análise de dados, conformidade de marca, entre outros cenários.

As Skills já cobrem toda a plataforma Claude.ai, Claude Code, API, e um repositório GitHub aberto (atualmente com mais de 80 mil estrelas). Mas a maior limitação das versões iniciais era que usuários não técnicos podiam apenas iterar com base na intuição, sem conseguir validar os resultados de forma quantitativa.

Existem dois tipos de Skills:

1. Tipo de Melhoria de Capacidade

Coisas que o modelo originalmente "não conseguia" ou "não eram estáveis" podem ser estabilizadas através da injeção de técnicas e padrões específicos por meio das Skills.

2. Tipo de Codificação de Preferências

O modelo pode fazer cada passo, mas precisa seguir uma ordem rigorosa de acordo com o processo específico da equipe.

5 Destaques desta Atualização:

  • Evals (avaliação automatizada): O usuário só precisa descrever "palavras-chave de teste + aparência esperada de saída" e o skill-creator executa a validação automaticamente.
  • Modo Benchmark: Executa testes padronizados em lote, produzindo taxas de aprovação, tempo gasto, consumo de Tokens e outros indicadores duros.
  • Execução Paralela de Múltiplos Agentes: Contextos independentes e limpos, evitando contaminação, aumentando drasticamente a velocidade dos testes.
  • Comparator (comparação cega): Teste A/B de duas versões de skills.
  • Description Tuning (otimização de descrição): Analisa automaticamente amostras de prompts e sugere modificações na descrição.

02 - Sem razões para não instalar! Esta atualização revive habilidades antigas

A atualização da Anthropic para o skill-creator rapidamente gerou discussões acaloradas entre profissionais e desenvolvedores de AI Agents.

03 - O momento de CI/CD dos Agentes de IA: de obras de arte a produtos de engenharia

A atualização da Anthropic para o skill-creator é essencialmente a introdução do ciclo fechado mais maduro de "teste - benchmark - iteração" da engenharia de software para usuários comuns e equipes empresariais de forma acessível. Isso significa que Agent Skills não é mais um projeto de prompt descartável, mas um "ativo vivo" que pode ser mantido continuamente, compatível entre versões de modelos e otimizado de forma datificada.

A curto prazo, os maiores beneficiários são os desenvolvedores e usuários empresariais que já acumularam uma grande quantidade de skills personalizadas no Claude Code / Cowork.

E olhando de uma perspectiva mais ampla, esta atualização solidificou ainda mais a "margem de proteção da cadeia de ferramentas" da Anthropic no ecossistema de Agentes.

Published in Technology

You Might Also Like