Agent Skills အရေးကြီးပြောင်းလဲမှု! Anthropic သည် ကျွမ်းကျင်မှုစက်ရုံကို နောက်ထပ် အဆင့်မြှင့်တင်ပြီး နျူကလီးယားအဆင့် evals စနစ်ထဲသို့ ထည့်သွင်းခဲ့သည်၊ ဖွံ့ဖြိုးသူများ: အဟောင်းကျွမ်းကျင်မှုများကို အသက်ပြန်လည်ရရှိစေသည်
Agent Skills အရေးကြီးပြောင်းလဲမှု! Anthropic သည် ကျွမ်းကျင်မှုစက်ရုံကို နောက်ထပ် အဆင့်မြှင့်တင်ပြီး နျူကလီးယားအဆင့် evals စနစ်ထဲသို့ ထည့်သွင်းခဲ့သည်၊ ဖွံ့ဖြိုးသူများ: အဟောင်းကျွမ်းကျင်မှုများကို အသက်ပြန်လည်ရရှိစေသည်
智猩猩AI整理 | 编辑:汐汐
AI အထောက်အကူပြုစက်များ၏ နယ်ပယ်တွင် Agent Skills ကို အသုံးပြုခဲ့ရင် skill-creator ကို သိရှိမိမယ်၊ ၎င်းသည် Anthropic မှ 2025 တွင် ထုတ်လုပ်ခဲ့သော skills ရှိသော ကုဒ်မလိုအပ်သော တည်ဆောက်မှုကိရိယာတစ်ခုဖြစ်သည်။
သို့သော် skill ကို တည်ဆောက်ပြီးနောက်၊ ၎င်း skill သည် အသုံးဝင်မလား၊ မော်ဒယ်အသစ်သည် အသုံးပြုနိုင်မလား၊ အတိအကျလုပ်ဆောင်နိုင်မလား၊ အကျိုးသက်ရောက်မှုက ဘယ်လိုလဲဆိုတာကို မသိနိုင်ပါ။
မတ် ၃ ရက်နေ့တွင် Anthropic ၏ တရားဝင်ဘလော့ခ်တွင် "Improving skill-creator: Test, measure, and refine Agent Skills" ဟု အမည်ရသော အရေးကြီးအပ်ဒိတ်တစ်ခုကို တိတ်တိတ်ဆိတ်ဆိတ် ထုတ်ပြန်ခဲ့သည်။ ၎င်းအဆင့်မြှင့်တင်မှုသည် Claude ၏ "ကျွမ်းကျင်မှုစက်ရုံ" ကို အမှန်တကယ် အဆင့်မြှင့်တင်စေသည်။
"အသုံးပြုနိုင်သည်" မှ "စမ်းသပ်နိုင်သော၊ တိုင်းတာနိုင်သော၊ ပြန်လည်တိုးတက်နိုင်သော" သို့ ပြောင်းလဲခြင်းက အရင်က ကျွမ်းကျင်မှုရေးသားသူများ၏ အကြီးမားဆုံး အခက်အခဲကို ဖြေရှင်းခဲ့သည်၊ အဲဒါက "ကျွန်ုပ်လုပ်ထားသော ကျွမ်းကျင်မှုသည် အထူးသင့်လျော်ပါသလား?"
01 - Agent Skills ပြန်လည်သုံးသပ်ခြင်း: အထွေထွေ အကူအညီမှ အထူးကျွမ်းကျင်စက်များသို့ အရေးကြီးအဆင့်တစ်ခု
2025 ခုနှစ် အောက်တိုဘာတွင် Anthropic သည် Agent Skills ကို တရားဝင်ထုတ်လုပ်ခဲ့သည်၊ ၎င်းသည် မော်ဂျူးများ၊ ပြန်လည်အသုံးပြုနိုင်သော "ကျွမ်းကျင်မှုအထုပ်" စနစ်တစ်ခုဖြစ်သည်။ ဖိုင်အုပ်တစ်ခုတွင် SKILL.md ညွှန်ကြားချက်၊ စကရစ်ပ်များ၊ အရင်းအမြစ်များ ပါရှိပြီး Claude သည် လိုအပ်သောအခါ အလိုအလျောက် လိုက်လျောညီထွေစွာ တင်သွင်းသည်၊ စာရွက်စာတမ်းထုတ်လုပ်ခြင်း၊ ဒေတာခွဲခြမ်းစိတ်ဖြာခြင်း၊ အမှတ်တံဆိပ်လိုက်နာမှု စသည့် အခြေအနေများတွင် အထူးသင့်လျော်မှုကို တိုးတက်စေသည်။
Skills သည် Claude.ai၊ Claude Code၊ API အပြည့်အဝ ပလက်ဖောင်းကို လက်လှမ်းမီပြီး GitHub ရှိ စုစုပေါင်း ၈၀,၀၀၀ ကျော်ကို ဖွင့်လှစ်ထားသည်။ သို့သော် အစောပိုင်းဗားရှင်း၏ အကြီးမားဆုံး ကန့်သတ်ချက်မှာ နည်းပညာမရှိသော အသုံးပြုသူများသည် ခံစားချက်အပေါ် မူတည်၍ ပြန်လည်တိုးတက်နိုင်ပြီး အကျိုးသက်ရောက်မှုကို တိုင်းတာ၍ အတည်ပြု၍ မရနိုင်ပါ။
Skills သည် နှစ်မျိုးရှိသည်။
1. စွမ်းရည်တိုးတက်မှုအမျိုးအစား
မော်ဒယ်သည် "မဖြစ်နိုင်" သို့မဟုတ် "မတည်ငြိမ်" ဖြစ်သော အရာများကို Skills ဖြင့် သတ်မှတ်ထားသော နည်းလမ်းများ၊ ပုံစံများကို ထည့်သွင်းခြင်းဖြင့် ထုတ်လုပ်မှုကို တည်ငြိမ်စေသည်။
2. အကြိုက်ကုဒ်အမျိုးအစား
မော်ဒယ်သည် အဆင့်တိုင်းကို လုပ်ဆောင်နိုင်သော်လည်း အဖွဲ့၏ သတ်မှတ်ထားသော လုပ်ငန်းစဉ်အရ တိတိကျကျ စီစဉ်ရန် လိုအပ်သည်။
ဤအဆင့်မြှင့်တင်မှု၏ ၅ ကြီးမားသော အထူးသဖြစ်များ:
- Evals (အလိုအလျောက် အကဲဖြတ်ခြင်း): အသုံးပြုသူသည် "စမ်းသပ်မှု အကြောင်းအရာ + မျှော်လင့်ထားသော ထွက်ရှိမှု" ကို ဖော်ပြရုံဖြင့် skill-creator သည် အလိုအလျောက် လုပ်ဆောင်မှုကို စစ်ဆေးသည်။
- Benchmark မော်ဒယ်: စံချိန်စံညွှန်း စမ်းသပ်မှုများကို အစုအဖွဲ့ဖြင့် ပြုလုပ်ပြီး အောင်မြင်မှုနှုန်း၊ အချိန်ကုန်ကျမှု၊ Token အသုံးပြုမှု စသည့် ခိုင်မာသော အချက်အလက်များကို ထုတ်လုပ်သည်။
- မျိုးစုံ အေးဂျင့်များကို တစ်ပြိုင်နက် လုပ်ဆောင်ခြင်း: သီးသန့် သန့်ရှင်းသော အကြောင်းအရာများ၊ အညစ်အကြေးများကို ရှောင်ရှားပြီး စမ်းသပ်မှု အမြန်နှုန်းကို တိုးတက်စေသည်။
- Comparator (အမြင်မရှိ စမ်းသပ်မှု နှိုင်းယှဉ်ခြင်း): A/B စမ်းသပ်မှုနှစ်ခုကို နှိုင်းယှဉ်သည်။
- Description Tuning (ဖျက်သိမ်းဖော်ပြချက် အဆင့်မြှင့်ခြင်း): နမူနာ အကြောင်းအရာကို အလိုအလျောက် ခွဲခြမ်းစိတ်ဖြာပြီး ဖော်ပြချက်ကို ပြင်ဆင်ရန် အကြံပြုသည်။
02 - ထည့်သွင်းရန် အကြောင်းအရာ မရှိပါ! ဤအဆင့်မြှင့်တင်မှုသည် အဟောင်းကျွမ်းကျင်မှုများကို အသက်ပြန်လည်ရရှိစေသည်
Anthropic ၏ skill-creator အတွက် ဤအဆင့်မြှင့်တင်မှုသည် AI Agent အလုပ်သမားများနှင့် ဖွံ့ဖြိုးသူများအကြား အမြန်ဆုံး ဆွေးနွေးမှုကို ဖြစ်စေခဲ့သည်။
03 - AI အထောက်အကူပြုစက်များ၏ CI/CD အချိန်: အနုပညာအရာမှ အင်ဂျင်နီယာထုတ်ကုန်သို့ ပြောင်းလဲခြင်း
Anthropic ၏ skill-creator အတွက် ဤအဆင့်မြှင့်တင်မှုသည် အခြေခံအားဖြင့် ဆော့ဖ်ဝဲအင်ဂျင်နီယာတွင် အထူးသင့်လျော်သော "စမ်းသပ်မှု-စံချိန်-ပြန်လည်တိုးတက်မှု" ပတ်ဝန်းကျင်ကို ပုံမှန်အသုံးပြုသူများနှင့် စီးပွားရေးအဖွဲ့များသို့ လွယ်ကူစွာ ရောက်ရှိစေသည်။ ၎င်းသည် Agent Skills သည် "ရေးပြီး ပစ်" လုပ်ငန်းစဉ်တစ်ခုသာ မဟုတ်ဘဲ ဆက်လက်ထိန်းသိမ်းနိုင်ပြီး မော်ဒယ်ဗားရှင်းများအကြား သဟဇာတရှိပြီး ဒေတာအခြေခံ အဆင့်မြှင့်တင်နိုင်သော "အသက်ရှိသော အရင်းအမြစ်" ဖြစ်လာသည်။
တိုချိန်တွင် အကျိုးခံစားသူအကြီးမားဆုံးမှာ Claude Code / Cowork တွင် အများအပြား ကိုယ်ပိုင်ကျွမ်းကျင်မှုများကို စုဆောင်းထားသော ဖွံ့ဖြိုးသူများနှင့် စီးပွားရေးအသုံးပြုသူများဖြစ်သည်။
ထို့အပြင် ပိုမိုကျယ်ပြန့်သော အမြင်မှ ဤအဆင့်မြှင့်တင်မှုသည် Anthropic ၏ Agent အစည်းအဝေးတွင် "ကိရိယာများ၏ ကာကွယ်ရေး" ကို ပိုမိုခိုင်မာစေသည်။

