Agent Skills значајна иновација! Anthropic надгради фабриката за вештини со нуклеарен ниво на evals систем, развивачи: стари вештини повторно во живот
Agent Skills значајна иновација! Anthropic надгради фабриката за вештини со нуклеарен ниво на evals систем, развивачи: стари вештини повторно во живот
智猩猩AI整理 | 编辑:汐汐
Во областа на AI агенти, ако сте користеле Agent Skills, сигурно сте запознаени со skill-creator, алатка за изградба на вештини без код, која ја објави Anthropic во 2025 година.
Но, откако ќе се создаде вештината, сè уште не знаете дали таа е корисна, дали новиот модел може да се користи, дали работи точно, каков е ефектот...
На 3 март, официјалниот блог на Anthropic тивко објави значајно ажурирање, наречено Improving skill-creator: Test, measure, and refine Agent Skills. Оваа надградба ја направи "фабриката за вештини" на Claude навистина зрела.
Од "изгледа дека може да се користи" до "може да се тестира, да се мери, да се итера", целосно го реши најголемиот проблем на авторите на вештини, а тоа е "дали вештината што ја направив е навистина корисна?"
01 - Преглед на Agent Skills: Клучен чекор од општ асистент до професионален агент
Во октомври 2025, Anthropic официјално ја лансираше Agent Skills, што е модуларен, повторно употреблив систем на "вештински пакети". Една папка содржи SKILL.md инструкции, скрипти, ресурси, Claude автоматски ги вчитува кога е потребно, значително го подобрува генерирањето на документи, анализа на податоци, усогласеност со брендот и други сценарија.
Вештините се покриени на Claude.ai, Claude Code, API целата платформа и е отворен GitHub репозиторум (моментално со над 80.000 ѕвезди). Но, најголемата ограниченост на раните верзии беше тоа што не-техничките корисници можат да итерат само врз основа на чувство, без можност за квантитативно потврдување на ефектот.
Вештините имаат два типа:
1. Тип за подобрување на способности
Работите што моделот првично "не може" или "не е стабилно" да ги прави, се стабилизираат со инјектирање специфични вештини и модели преку Вештини.
2. Тип за кодирање на преференции
Моделот може да прави сè, но треба строго да се редоследи според специфичните процеси на тимот.
Петте главни точки на оваа надградба:
- Evals (автоматизирана проценка): Корисниците само треба да опишат "тестирање на клучни зборови + очекуван изглед на излезот" skill-creator автоматски извршува валидација.
- Benchmark режим: Масовно извршување на стандардизирани тестови, излез на стапка на успех, времетраење, потрошувачка на токени и други тврди индикатори.
- Паралелно извршување на повеќе агенти: независен чист контекст, избегнување на контаминација, тестирање со зголемена брзина.
- Comparator (слепо тестирање): A/B тестирање на две верзии на вештини.
- Description Tuning (оптимизација на описот): Автоматска анализа на примероци на клучни зборови, предлагање на измени во описот.
02 - Нема причина да не се инсталира! Оваа надградба ги враќа старите вештини во живот
Anthropic за skill-creator оваа надградба брзо предизвика расправа меѓу професионалците и развивачите на AI агенти.
03 - CI/CD момент на AI агенти: од уметничко дело до инжинерски производ
Anthropic оваа надградба на skill-creator, всушност, ја донесе најзрела затворена петља "тестирање-бенчмарк-итерација" од софтверското инженерство до обичните корисници и тимови на компании со ниски бариери. Ова значи дека Agent Skills повеќе не е "еднократен" проект за промпт, туку може да се одржува континуирано, компатибилен преку верзии на модели, и оптимизиран со податоци како "жива имот".
Во краток рок, најголемите бенефитери се развивачите и корисниците на компании кои веќе акумулирале голем број на прилагодени вештини во Claude Code / Cowork.
А ако погледнеме од поширока перспектива, оваа надградба дополнително ја зајакна "алатната лента" на Anthropic во екосистемот на агенти.

