Агент дағдыларының маңызды жаңаруы! Anthropic дағдылар фабрикасын ядролық деңгейдегі evals жүйесіне жаңартты, әзірлеуші: ескі дағдылар қайта тірілді

3/9/2026
3 min read

Агент дағдыларының маңызды жаңаруы! Anthropic дағдылар фабрикасын ядролық деңгейдегі evals жүйесіне жаңартты, әзірлеуші: ескі дағдылар қайта тірілді

Ақылды маймыл AI жинақтады | Редактор: Си Си

AI интеллект агенттері саласында, егер сіз Агент дағдыларын пайдаланған болсаңыз, онда сіз міндетті түрде skill-creator туралы білесіз, бұл 2025 жылы Anthropic шығарған дағдыларды кодсыз құру құралы.

Бірақ дағдыларды құрып болғаннан кейін, бұл дағдының пайдалы екендігін, жаңа модельдің әлі де жұмыс істейтіндігін, жұмыс дәлдігін, әсерін қалай білуге болады...

3 наурызда Anthropic ресми блогында "Improving skill-creator: Test, measure, and refine Agent Skills" атты маңызды жаңарту quietly жарияланды. Бұл жаңарту Claude-ның "дағдылар фабрикасын" шын мәнінде жетілдірді.

"Көрінетін" пайдаланудан "тестілейтін, өлшейтін, итерациялайтын" деңгейге өту, бұрынғы дағдылар авторларының ең үлкен мәселесін, яғни "мен жасаған дағды шынымен пайдалы ма?" деген сұрақты толық шешті.

01 - Агент дағдыларына шолу: жалпы көмекшіден кәсіби интеллект агентіне маңызды қадам

2025 жылдың қазанында Anthropic ресми түрде Агент дағдыларын шығарды, бұл модульдік, қайта пайдалануға болатын "дағдылар пакеті" жүйесі. Бір папкада SKILL.md нұсқаулары, сценарийлер, ресурстар бар, Claude қажет болғанда автоматты түрде жүктейді, құжаттарды генерациялау, деректерді талдау, бренд сәйкестігі сияқты сценарийлердің өнімділігін айтарлықтай арттырады.

Дағдылар Claude.ai, Claude Code, API барлық платформаларын қамтиды және GitHub репозиторийін ашты (қазіргі уақытта жұлдыздар саны 80 мыңнан асады). Бірақ ерте нұсқалардың ең үлкен шектеуі - техникалық емес пайдаланушылар тек сезіммен итерация жасай алады, әсерін сандық түрде тексере алмайды.

Дағдылардың екі түрі бар:

1. Қабілетті арттыру түрі

Модельдің "істей алмайтын" немесе "тұрақсыз істейтін" нәрселерін, дағдылар арқылы арнайы әдістер мен үлгілерді енгізу арқылы тұрақты шығару.

2. Қалауларды кодтау түрі

Модель әр қадамды істей алады, бірақ командаға тән процесті қатаң ретпен орындауды талап етеді.

Бұл жаңартудың 5 негізгі ерекшелігі:

  • Evals (автоматты бағалау): Пайдаланушылар "тест сұрау + күтілетін шығу түрі" сипаттауы керек, skill-creator автоматты түрде тексереді.
  • Benchmark режимі: стандартталған тесттерді жаппай өткізу, өту деңгейі, уақыт, Token шығыны сияқты қатал көрсеткіштерді шығару.
  • Көп агенттер параллельді орындау: таза контекст, ластануды болдырмау, тест жылдамдығының күрт артуы.
  • Comparator (жасырын тестілеу): A/B тесті екі дағды нұсқасын.
  • Description Tuning (сипаттаманы оңтайландыру): үлгі сұрауларды автоматты түрде талдау, сипаттаманы өзгерту ұсыныстары.

02 - Орнатуға себеп жоқ емес! Бұл жаңарту ескі дағдыларды қайта тірілтті

Anthropic-тың skill-creator-ға жасаған бұл жаңартуы, AI агенттері мен әзірлеушілер арасында жедел пікірталас тудырды.

03 - AI интеллект агенттерінің CI/CD сәті: өнер туындысынан инженерлік өнімге айналды

Anthropic-тың skill-creator-ға жасаған жаңартуы, негізінен, бағдарламалық инженериядағы ең жетілген "тест-стандарт-итерация" циклін, қарапайым пайдаланушылар мен корпоративтік командаларға төменгі шекпен жеткізді. Бұл Агент дағдылары енді "жазып, лақтырып тастайтын" бір реттік prompt жобасы емес, үздіксіз қолдауға, модельдер арасындағы үйлесімділікке, деректермен оңтайландыруға болатын "тірі актив".

Қысқа мерзімде, ең үлкен пайда алушылар - Claude Code / Cowork платформасында көп мөлшерде теңшелген дағдыларды жинақтаған әзірлеушілер мен корпоративтік пайдаланушылар.

Ал кеңірек көзқараспен қарағанда, бұл жаңарту Anthropic-тың Агент экожүйесіндегі "құралдар тізбегі" қорғанысын одан әрі нығайтты.

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy өзгерту нұсқаулығы: қалай жарқыраған аңыз деңгейіндегі питомец алуға болады

Claude Code Buddy өзгерту нұсқаулығы: қалай жарқыраған аңыз деңгейіндегі питомец алуға болады 2026 жылдың 1 сәуірінде, A...

Obsidian Defuddle-ды шығарды, Obsidian Web Clipper-ді жаңа деңгейге көтердіTechnology

Obsidian Defuddle-ды шығарды, Obsidian Web Clipper-ді жаңа деңгейге көтерді

Obsidian Defuddle-ды шығарды, Obsidian Web Clipper-ді жаңа деңгейге көтерді Мен Obsidian-ның негізгі идеясын әрқашан ұн...

OpenAI кенеттен "үш бірлікті" жариялады: браузер + бағдарламалау + ChatGPT бірігуі, ішкі деңгейде өткен жылы қателескенін мойындадыTechnology

OpenAI кенеттен "үш бірлікті" жариялады: браузер + бағдарламалау + ChatGPT бірігуі, ішкі деңгейде өткен жылы қателескенін мойындады

OpenAI кенеттен "үш бірлікті" жариялады: браузер + бағдарламалау + ChatGPT бірігуі, ішкі деңгейде өткен жылы қателескені...

2026, өзіңізді "тәртіпке" мәжбүрлемеңіз! Бұл 8 кішігірім істі орындаңыз, денсаулық өздігінен келедіHealth

2026, өзіңізді "тәртіпке" мәжбүрлемеңіз! Бұл 8 кішігірім істі орындаңыз, денсаулық өздігінен келеді

2026, өзіңізді "тәртіпке" мәжбүрлемеңіз! Бұл 8 кішігірім істі орындаңыз, денсаулық өздігінен келеді Жаңа жыл басталды, ...

Салмақ тастауға тырысқан, бірақ арықтай алмай жүрген аналар, мүлдем осында құлайдыHealth

Салмақ тастауға тырысқан, бірақ арықтай алмай жүрген аналар, мүлдем осында құлайды

[[HTMLPLACEHOLDER0]] Наурыздың жартысы өтті, сенің салмақ тастау жоспарың қалай? Арықтадың ба? Неше килограмм арықтадың...

📝
Technology

AI Browser 24 сағат тұрақты жұмыс істеу нұсқаулығы

AI Browser 24 сағат тұрақты жұмыс істеу нұсқаулығы Бұл нұсқаулық тұрақты, ұзақ мерзімді AI браузер ортасын қалай құруды ...