Agente Skills: Grande Inovação! Anthropic Atualiza a Fábrica de Habilidades com um Sistema de Evals de Nível Nuclear, Desenvolvedores: Habilidades Antigas Revivem
Agente Skills: Grande Inovação! Anthropic Atualiza a Fábrica de Habilidades com um Sistema de Evals de Nível Nuclear, Desenvolvedores: Habilidades Antigas Revivem
智猩猩AI整理 | 编辑:汐汐
No campo dos agentes de IA, se você já usou o Agent Skills, com certeza conhece o skill-creator, uma ferramenta de construção de skills sem código lançada pela Anthropic em 2025.
No entanto, após construir uma skill, ainda não se sabe se essa skill é útil, se o novo modelo ainda pode ser usado, se está funcionando corretamente, como está o desempenho...
No dia 3 de março, o blog oficial da Anthropic lançou discretamente uma atualização importante, chamada Improving skill-creator: Test, measure, and refine Agent Skills. Esta atualização fez com que a "fábrica de habilidades" do Claude realmente amadurecesse.
De "parece que funciona" para "testável, mensurável, iterável", resolveu completamente a maior dor de cabeça dos autores de skills anteriores, que é "a skill que eu fiz realmente funciona bem?"
01 - Revisão do Agent Skills: Um Passo Crucial de Assistente Geral para Agente Especializado
Em outubro de 2025, a Anthropic lançou oficialmente o Agent Skills, que é um sistema de "pacotes de habilidades" modular e reutilizável. Uma pasta contém instruções SKILL.md, scripts e recursos, que o Claude carrega automaticamente quando necessário, melhorando significativamente o desempenho em geração de documentos, análise de dados, conformidade de marca, entre outros cenários.
As Skills já cobrem toda a plataforma Claude.ai, Claude Code, API, e um repositório GitHub aberto (atualmente com mais de 80 mil estrelas). Mas a maior limitação das versões iniciais era que usuários não técnicos podiam apenas iterar com base na intuição, sem conseguir validar os resultados de forma quantitativa.
Existem dois tipos de Skills:
1. Tipo de Melhoria de Capacidade
Coisas que o modelo originalmente "não conseguia" ou "não eram estáveis" podem ser estabilizadas através da injeção de técnicas e padrões específicos por meio das Skills.
2. Tipo de Codificação de Preferências
O modelo pode fazer cada passo, mas precisa seguir uma ordem rigorosa de acordo com o processo específico da equipe.
5 Destaques desta Atualização:
- Evals (avaliação automatizada): O usuário só precisa descrever "palavras-chave de teste + aparência esperada de saída" e o skill-creator executa a validação automaticamente.
- Modo Benchmark: Executa testes padronizados em lote, produzindo taxas de aprovação, tempo gasto, consumo de Tokens e outros indicadores duros.
- Execução Paralela de Múltiplos Agentes: Contextos independentes e limpos, evitando contaminação, aumentando drasticamente a velocidade dos testes.
- Comparator (comparação cega): Teste A/B de duas versões de skills.
- Description Tuning (otimização de descrição): Analisa automaticamente amostras de prompts e sugere modificações na descrição.
02 - Sem razões para não instalar! Esta atualização revive habilidades antigas
A atualização da Anthropic para o skill-creator rapidamente gerou discussões acaloradas entre profissionais e desenvolvedores de AI Agents.
03 - O momento de CI/CD dos Agentes de IA: de obras de arte a produtos de engenharia
A atualização da Anthropic para o skill-creator é essencialmente a introdução do ciclo fechado mais maduro de "teste - benchmark - iteração" da engenharia de software para usuários comuns e equipes empresariais de forma acessível. Isso significa que Agent Skills não é mais um projeto de prompt descartável, mas um "ativo vivo" que pode ser mantido continuamente, compatível entre versões de modelos e otimizado de forma datificada.
A curto prazo, os maiores beneficiários são os desenvolvedores e usuários empresariais que já acumularam uma grande quantidade de skills personalizadas no Claude Code / Cowork.
E olhando de uma perspectiva mais ampla, esta atualização solidificou ainda mais a "margem de proteção da cadeia de ferramentas" da Anthropic no ecossistema de Agentes.

