Agentes de Habilidades: Grande Inovação! Anthropic Atualiza a Fábrica de Habilidades com um Sistema de Avaliação de Nível Nuclear, Desenvolvedores: Habilidades Antigas Revivem

3/9/2026
3 min read

Agentes de Habilidades: Grande Inovação! Anthropic Atualiza a Fábrica de Habilidades com um Sistema de Avaliação de Nível Nuclear, Desenvolvedores: Habilidades Antigas Revivem

智猩猩AI整理 | 编辑:汐汐

No campo dos agentes de IA, se você já usou Agentes de Habilidades, com certeza conhece o skill-creator, uma ferramenta de construção de habilidades sem código lançada pela Anthropic em 2025.

Mas após construir uma habilidade, ainda é impossível saber se essa habilidade é útil, se o novo modelo ainda funciona, se a execução é precisa, e como é o desempenho...

No dia 3 de março, o blog oficial da Anthropic lançou discretamente uma atualização significativa chamada "Melhorando o skill-creator: Testar, medir e refinar Agentes de Habilidades". Essa atualização fez com que a "fábrica de habilidades" do Claude realmente amadurecesse.

De "parece que funciona" para "testável, mensurável e iterável", resolveu completamente a maior dor de cabeça dos autores de habilidades, que é "a habilidade que eu criei realmente funciona bem?"

01 - Revisão dos Agentes de Habilidades: Um Passo Crucial de Assistente Geral para Agente Especializado

Em outubro de 2025, a Anthropic lançou oficialmente os Agentes de Habilidades, um sistema de "pacotes de habilidades" modular e reutilizável. Uma pasta contém instruções SKILL.md, scripts e recursos, que o Claude carrega automaticamente quando necessário, melhorando significativamente o desempenho em geração de documentos, análise de dados, conformidade de marca, entre outros cenários.

As Habilidades já cobrem toda a plataforma Claude.ai, Claude Code e API, e um repositório GitHub foi aberto (atualmente com mais de 80 mil estrelas). Mas a maior limitação das versões iniciais era que usuários não técnicos podiam apenas iterar com base na intuição, sem conseguir quantificar a eficácia.

Existem dois tipos de Habilidades:

1. Tipo de Aumento de Capacidade

Coisas que o modelo originalmente "não conseguia" ou "não era estável" podem ser estabilizadas através da injeção de técnicas e padrões específicos por meio das Habilidades.

2. Tipo de Codificação de Preferências

O modelo pode fazer cada passo, mas precisa seguir uma ordem rigorosa de acordo com o processo específico da equipe.

5 Destaques desta Atualização:

  • Evals (avaliação automatizada): O usuário só precisa descrever "palavras-chave de teste + aparência esperada da saída" e o skill-creator executa a validação automaticamente.
  • Modo Benchmark: Executa testes padronizados em lote, gerando métricas duras como taxa de aprovação, tempo gasto e consumo de Tokens.
  • Execução Paralela de Múltiplos Agentes: Contextos independentes e limpos, evitando contaminação, aumentando drasticamente a velocidade dos testes.
  • Comparator (comparação cega): Teste A/B de duas versões de habilidades.
  • Description Tuning (otimização de descrição): Analisa automaticamente amostras de prompts e sugere modificações na descrição.

02 - Sem razões para não instalar! Esta atualização faz as habilidades antigas reviverem

A atualização da Anthropic para o skill-creator rapidamente gerou discussões entre profissionais e desenvolvedores de Agentes de IA.

03 - O momento CI/CD dos Agentes de IA: De obra de arte a produto de engenharia

A atualização da Anthropic para o skill-creator é, essencialmente, a introdução do ciclo fechado mais maduro de "testar - benchmark - iterar" da engenharia de software, acessível a usuários comuns e equipes empresariais. Isso significa que as Agentes de Habilidades não são mais um projeto de prompt descartável, mas um "ativo vivo" que pode ser mantido continuamente, compatível entre versões de modelos e otimizado com dados.

A curto prazo, os maiores beneficiários são os desenvolvedores e usuários empresariais que já acumularam muitas habilidades personalizadas no Claude Code / Cowork.

E em uma perspectiva mais ampla, esta atualização solidificou ainda mais a "margem de proteção da cadeia de ferramentas" da Anthropic no ecossistema de Agentes.

Published in Technology

You Might Also Like