Агент дағдыларының маңызды жаңаруы! Anthropic дағдылар фабрикасын ядролық деңгейдегі evals жүйесіне жаңартты, әзірлеуші: ескі дағдылар қайта тірілді
Агент дағдыларының маңызды жаңаруы! Anthropic дағдылар фабрикасын ядролық деңгейдегі evals жүйесіне жаңартты, әзірлеуші: ескі дағдылар қайта тірілді
Ақылды маймыл AI жинақтады | Редактор: Си Си
AI интеллект агенттері саласында, егер сіз Агент дағдыларын пайдаланған болсаңыз, онда сіз міндетті түрде skill-creator туралы білесіз, бұл 2025 жылы Anthropic шығарған дағдыларды кодсыз құру құралы.
Бірақ дағдыларды құрып болғаннан кейін, бұл дағдының пайдалы екендігін, жаңа модельдің әлі де жұмыс істейтіндігін, жұмыс дәлдігін, әсерін қалай білуге болады...
3 наурызда Anthropic ресми блогында "Improving skill-creator: Test, measure, and refine Agent Skills" атты маңызды жаңарту quietly жарияланды. Бұл жаңарту Claude-ның "дағдылар фабрикасын" шын мәнінде жетілдірді.
"Көрінетін" пайдаланудан "тестілейтін, өлшейтін, итерациялайтын" деңгейге өту, бұрынғы дағдылар авторларының ең үлкен мәселесін, яғни "мен жасаған дағды шынымен пайдалы ма?" деген сұрақты толық шешті.
01 - Агент дағдыларына шолу: жалпы көмекшіден кәсіби интеллект агентіне маңызды қадам
2025 жылдың қазанында Anthropic ресми түрде Агент дағдыларын шығарды, бұл модульдік, қайта пайдалануға болатын "дағдылар пакеті" жүйесі. Бір папкада SKILL.md нұсқаулары, сценарийлер, ресурстар бар, Claude қажет болғанда автоматты түрде жүктейді, құжаттарды генерациялау, деректерді талдау, бренд сәйкестігі сияқты сценарийлердің өнімділігін айтарлықтай арттырады.
Дағдылар Claude.ai, Claude Code, API барлық платформаларын қамтиды және GitHub репозиторийін ашты (қазіргі уақытта жұлдыздар саны 80 мыңнан асады). Бірақ ерте нұсқалардың ең үлкен шектеуі - техникалық емес пайдаланушылар тек сезіммен итерация жасай алады, әсерін сандық түрде тексере алмайды.
Дағдылардың екі түрі бар:
1. Қабілетті арттыру түрі
Модельдің "істей алмайтын" немесе "тұрақсыз істейтін" нәрселерін, дағдылар арқылы арнайы әдістер мен үлгілерді енгізу арқылы тұрақты шығару.
2. Қалауларды кодтау түрі
Модель әр қадамды істей алады, бірақ командаға тән процесті қатаң ретпен орындауды талап етеді.
Бұл жаңартудың 5 негізгі ерекшелігі:
- Evals (автоматты бағалау): Пайдаланушылар "тест сұрау + күтілетін шығу түрі" сипаттауы керек, skill-creator автоматты түрде тексереді.
- Benchmark режимі: стандартталған тесттерді жаппай өткізу, өту деңгейі, уақыт, Token шығыны сияқты қатал көрсеткіштерді шығару.
- Көп агенттер параллельді орындау: таза контекст, ластануды болдырмау, тест жылдамдығының күрт артуы.
- Comparator (жасырын тестілеу): A/B тесті екі дағды нұсқасын.
- Description Tuning (сипаттаманы оңтайландыру): үлгі сұрауларды автоматты түрде талдау, сипаттаманы өзгерту ұсыныстары.
02 - Орнатуға себеп жоқ емес! Бұл жаңарту ескі дағдыларды қайта тірілтті
Anthropic-тың skill-creator-ға жасаған бұл жаңартуы, AI агенттері мен әзірлеушілер арасында жедел пікірталас тудырды.
03 - AI интеллект агенттерінің CI/CD сәті: өнер туындысынан инженерлік өнімге айналды
Anthropic-тың skill-creator-ға жасаған жаңартуы, негізінен, бағдарламалық инженериядағы ең жетілген "тест-стандарт-итерация" циклін, қарапайым пайдаланушылар мен корпоративтік командаларға төменгі шекпен жеткізді. Бұл Агент дағдылары енді "жазып, лақтырып тастайтын" бір реттік prompt жобасы емес, үздіксіз қолдауға, модельдер арасындағы үйлесімділікке, деректермен оңтайландыруға болатын "тірі актив".
Қысқа мерзімде, ең үлкен пайда алушылар - Claude Code / Cowork платформасында көп мөлшерде теңшелген дағдыларды жинақтаған әзірлеушілер мен корпоративтік пайдаланушылар.
Ал кеңірек көзқараспен қарағанда, бұл жаңарту Anthropic-тың Агент экожүйесіндегі "құралдар тізбегі" қорғанысын одан әрі нығайтты.

