Agent Skills значајна иновација! Anthropic надгради фабриката за вештини со нуклеарен ниво на evals систем, развивачи: стари вештини повторно во живот

3/9/2026
3 min read

Agent Skills значајна иновација! Anthropic надгради фабриката за вештини со нуклеарен ниво на evals систем, развивачи: стари вештини повторно во живот

智猩猩AI整理 | 编辑:汐汐

Во областа на AI агенти, ако сте користеле Agent Skills, сигурно сте запознаени со skill-creator, алатка за изградба на вештини без код, која ја објави Anthropic во 2025 година.

Но, откако ќе се создаде вештината, сè уште не знаете дали таа е корисна, дали новиот модел може да се користи, дали работи точно, каков е ефектот...

На 3 март, официјалниот блог на Anthropic тивко објави значајно ажурирање, наречено Improving skill-creator: Test, measure, and refine Agent Skills. Оваа надградба ја направи "фабриката за вештини" на Claude навистина зрела.

Од "изгледа дека може да се користи" до "може да се тестира, да се мери, да се итера", целосно го реши најголемиот проблем на авторите на вештини, а тоа е "дали вештината што ја направив е навистина корисна?"

01 - Преглед на Agent Skills: Клучен чекор од општ асистент до професионален агент

Во октомври 2025, Anthropic официјално ја лансираше Agent Skills, што е модуларен, повторно употреблив систем на "вештински пакети". Една папка содржи SKILL.md инструкции, скрипти, ресурси, Claude автоматски ги вчитува кога е потребно, значително го подобрува генерирањето на документи, анализа на податоци, усогласеност со брендот и други сценарија.

Вештините се покриени на Claude.ai, Claude Code, API целата платформа и е отворен GitHub репозиторум (моментално со над 80.000 ѕвезди). Но, најголемата ограниченост на раните верзии беше тоа што не-техничките корисници можат да итерат само врз основа на чувство, без можност за квантитативно потврдување на ефектот.

Вештините имаат два типа:

1. Тип за подобрување на способности

Работите што моделот првично "не може" или "не е стабилно" да ги прави, се стабилизираат со инјектирање специфични вештини и модели преку Вештини.

2. Тип за кодирање на преференции

Моделот може да прави сè, но треба строго да се редоследи според специфичните процеси на тимот.

Петте главни точки на оваа надградба:

  • Evals (автоматизирана проценка): Корисниците само треба да опишат "тестирање на клучни зборови + очекуван изглед на излезот" skill-creator автоматски извршува валидација.
  • Benchmark режим: Масовно извршување на стандардизирани тестови, излез на стапка на успех, времетраење, потрошувачка на токени и други тврди индикатори.
  • Паралелно извршување на повеќе агенти: независен чист контекст, избегнување на контаминација, тестирање со зголемена брзина.
  • Comparator (слепо тестирање): A/B тестирање на две верзии на вештини.
  • Description Tuning (оптимизација на описот): Автоматска анализа на примероци на клучни зборови, предлагање на измени во описот.

02 - Нема причина да не се инсталира! Оваа надградба ги враќа старите вештини во живот

Anthropic за skill-creator оваа надградба брзо предизвика расправа меѓу професионалците и развивачите на AI агенти.

03 - CI/CD момент на AI агенти: од уметничко дело до инжинерски производ

Anthropic оваа надградба на skill-creator, всушност, ја донесе најзрела затворена петља "тестирање-бенчмарк-итерација" од софтверското инженерство до обичните корисници и тимови на компании со ниски бариери. Ова значи дека Agent Skills повеќе не е "еднократен" проект за промпт, туку може да се одржува континуирано, компатибилен преку верзии на модели, и оптимизиран со податоци како "жива имот".

Во краток рок, најголемите бенефитери се развивачите и корисниците на компании кои веќе акумулирале голем број на прилагодени вештини во Claude Code / Cowork.

А ако погледнеме од поширока перспектива, оваа надградба дополнително ја зајакна "алатната лента" на Anthropic во екосистемот на агенти.

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy измена упатство: Како да добиете сјаен легендарен милениче

Claude Code Buddy измена упатство: Како да добиете сјаен легендарен милениче На 1 април 2026 година, Anthropic во верзиј...

Obsidian ја лансираше Defuddle, го подигна Obsidian Web Clipper на ново нивоTechnology

Obsidian ја лансираше Defuddle, го подигна Obsidian Web Clipper на ново ниво

Obsidian ја лансираше Defuddle, го подигна Obsidian Web Clipper на ново ниво Уште од почетокот, многу ми се допаѓа осно...

OpenAI ненадејно објави "три во едно": спојување на прелистувач, програмирање и ChatGPT, внатрешно признавање на погрешниот пат во изминатата годинаTechnology

OpenAI ненадејно објави "три во едно": спојување на прелистувач, програмирање и ChatGPT, внатрешно признавање на погрешниот пат во изминатата година

OpenAI ненадејно објави "три во едно": спојување на прелистувач, програмирање и ChatGPT, внатрешно признавање на погрешн...

2026, не се присилувајте на "самодисциплина"! Направете ги овие 8 мали работи, здравјето ќе дојде природноHealth

2026, не се присилувајте на "самодисциплина"! Направете ги овие 8 мали работи, здравјето ќе дојде природно

2026, не се присилувајте на "самодисциплина"! Направете ги овие 8 мали работи, здравјето ќе дојде природно Нова година ...

Тие мајки кои се трудат да ослабат, но не успеваат, сигурно се заглавени тукаHealth

Тие мајки кои се трудат да ослабат, но не успеваат, сигурно се заглавени тука

Тие мајки кои се трудат да ослабат, но не успеваат, сигурно се заглавени тука Март веќе помина наполовина, како напреду...

📝
Technology

AI Browser 24 часов стабилно работење водич

AI Browser 24 часов стабилно работење водич Овој туторијал објаснува како да се постави стабилна, долгорочна средина за ...