એજન્ટ સ્કિલ્સમાં મહત્વપૂર્ણ સુધારો! એન્થ્રોપિકે સ્કિલ ફેક્ટરીને ન્યુક્લિયર-ગ્રેડ evals સિસ્ટમમાં અપગ્રેડ કર્યું, ડેવલપર: જૂની સ્કિલ્સને પુનર્જીવિત કરે છે
એજન્ટ સ્કિલ્સમાં મહત્વપૂર્ણ સુધારો! એન્થ્રોપિકે સ્કિલ ફેક્ટરીને ન્યુક્લિયર-ગ્રેડ evals સિસ્ટમમાં અપગ્રેડ કર્યું, ડેવલપર: જૂની સ્કિલ્સને પુનર્જીવિત કરે છે
智猩猩AI整理 | 编辑:汐汐
AI સ્માર્ટ એજન્ટ ક્ષેત્રમાં, જો તમે એજન્ટ સ્કિલ્સનો ઉપયોગ કર્યો છે, તો તમે skill-creator વિશે જાણતા જ હશો, જે એન્થ્રોપિક દ્વારા 2025 માં પ્રકાશિત થયેલું એક સ્કિલ્સ ઝીરો કોડ બિલ્ડિંગ ટૂલ છે.
પરંતુ સ્કિલ બનાવ્યા પછી, હજુ પણ ખબર નથી કે આ સ્કિલ ઉપયોગી છે કે નહીં, નવા મોડલનો ઉપયોગ થઈ શકે છે કે નહીં, ચલાવવાની ચોકસાઈ છે કે નહીં, પરિણામો કેવી રીતે છે...
3 માર્ચે, એન્થ્રોપિકના અધિકૃત બ્લોગે એક મહત્વપૂર્ણ અપડેટ પ્રકાશિત કર્યું, જેનું નામ છે Improving skill-creator: Test, measure, and refine Agent Skills. આ અપગ્રેડે Claude ના "સ્કિલ ફેક્ટરી" ને વાસ્તવમાં પરિપક્વતાની તરફ લઈ જવા માટે મદદ કરી.
"જુઓ તો ઉપયોગી લાગે છે" થી "પરીક્ષણ કરી શકાય તેવા, માપી શકાય તેવા, પુનરાવર્તિત" સુધી, અગાઉના સ્કિલ લેખકોની સૌથી મોટી સમસ્યાને સંપૂર્ણપણે ઉકેલવામાં આવ્યું, એટલે કે "મારી બનાવેલી સ્કિલ ખરેખર ઉપયોગી છે કે નહીં?"
01 - એજન્ટ સ્કિલ્સની સમીક્ષા: સામાન્ય સહાયકથી વ્યાવસાયિક સ્માર્ટ એજન્ટ તરફનો મહત્વપૂર્ણ પગલું
2025માં, એન્થ્રોપિકે અધિકૃત રીતે એજન્ટ સ્કિલ્સ રજૂ કર્યું, જે એક મૉડ્યુલર, પુનઃઉપયોગ કરી શકાય તેવા "સ્કિલ પેક" સિસ્ટમ છે. એક ફોલ્ડરમાં SKILL.md સૂચનાઓ, સ્ક્રિપ્ટો, સંસાધનો સમાવિષ્ટ છે, Claude જરૂર પડ્યે આપમેળે લોડ કરે છે, દસ્તાવેજ જનરેશન, ડેટા વિશ્લેષણ, બ્રાન્ડ અનુરૂપતા વગેરે દ્રષ્ટિકોણમાં પ્રદર્શનમાં નોંધપાત્ર વધારો કરે છે.
Skills એ Claude.ai, Claude Code, API સમગ્ર પ્લેટફોર્મને આવરી લે છે, અને GitHub રિપોઝિટરી ખોલી છે (હાલમાં સ્ટાર્સ 80,000 થી વધુ છે). પરંતુ પ્રારંભિક આવૃત્તિની સૌથી મોટી મર્યાદા એ હતી કે, અ-તકનિકી વપરાશકર્તાઓ માત્ર લાગણીના આધારે પુનરાવર્તિત કરી શકતા હતા, પરિણામોનું પ્રમાણિત પ્રમાણિત કરી શકતા નહોતા.
Skillsની બે પ્રકારો છે:
1. ક્ષમતા વધારવા પ્રકાર
મોડલ મૂળભૂત રીતે "કરવા માટે અસમર્થ" અથવા "અસ્થિર" બાબતોને Skills દ્વારા ચોક્કસ કૌશલ્ય, પેટર્નને દાખલ કરીને સ્થિર આઉટપુટ આપે છે.
2. પસંદગી કોડિંગ પ્રકાર
મોડલ દરેક પગલામાં કરી શકે છે, પરંતુ ટીમની ચોક્કસ પ્રક્રિયા અનુસાર કડક ક્રમમાં હોવું જોઈએ.
આ અપગ્રેડના 5 મુખ્ય હાઇલાઇટ્સ:
- Evals (સ્વચાલિત મૂલ્યાંકન): વપરાશકર્તાઓને "પરીક્ષણ સૂચન + અપેક્ષિત આઉટપુટ" વર્ણવવાની જરૂર છે, skill-creator આપમેળે ચલાવીને માન્યતા આપે છે.
- Benchmark મોડલ: ધોરણિત પરીક્ષણો ચલાવવા માટે બેચમાં, પસાર થવાની દર, સમય, ટોકન વપરાશ વગેરે કઠોર સૂચકાંકોને આઉટપુટ કરે છે.
- બહુ એજન્ટ સમકક્ષ અમલ: સ્વતંત્ર સ્વચ્છ સંદર્ભ, પ્રદૂષણ ટાળવા, પરીક્ષણની ગતિમાં નોંધપાત્ર વધારો.
- Comparator (અંધ પરીક્ષણ તુલના): A/B પરીક્ષણ બે સ્કિલ આવૃત્તિઓ.
- Description Tuning (પ્રેરણા વર્ણન સુધારણા): નમૂના સૂચનોનું આપમેળે વિશ્લેષણ, વર્ણન સુધારવા માટે સૂચનો આપે છે.
02 - ઇન્સ્ટોલ કરવા માટે કોઈ કારણ નથી! આ અપડેટ જૂની સ્કિલ્સને પુનર્જીવિત કરે છે
એન્થ્રોપિકે skill-creator માટે આ અપડેટ, ઝડપથી AI એજન્ટના વ્યવસાયિકો અને ડેવલપર્સ વચ્ચે ચર્ચા શરૂ કરી.
03 - AI સ્માર્ટ એજન્ટનું CI/CD ક્ષણ: કલા ના ઉત્પાદનોમાંથી એન્જિનિયરિંગ ઉત્પાદનોમાં પરિવર્તિત
એન્થ્રોપિકે skill-creator માટે આ અપગ્રેડ, મૂળભૂત રીતે સોફ્ટવેર એન્જિનિયરિંગમાં સૌથી પરિપક્વ "પરીક્ષણ-બેંચમાર્ક-પુનરાવર્તન" બંધનને સામાન્ય વપરાશકર્તાઓ અને કંપનીની ટીમોને નીચા દરે લાવ્યું છે. આનો અર્થ એ છે કે એજન્ટ સ્કિલ્સ હવે "લખી નાખ્યા પછી ફેંકી દેવું" એકવારના પ્રોમ્પ્ટ એન્જિનિયરિંગ નથી, પરંતુ સતત જાળવણી, ક્રોસ મોડલ આવૃત્તિઓમાં સુસંગત, ડેટા આધારિત સુધારણા કરી શકાય તેવા "જીવંત સંપત્તિ" છે.
અલ્પકાલમાં, સૌથી મોટા લાભાર્થીઓ એ છે જેમણે Claude Code / Cowork માં ઘણાં કસ્ટમ સ્કિલ્સ એકત્રિત કર્યા છે.
અને વધુ વ્યાપક દૃષ્ટિકોણમાં, આ અપડેટ એન્થ્રોપિકને એજન્ટ ઇકોસિસ્ટમમાં "ટૂલચેઇન કિલ્લો" વધુ મજબૂત બનાવે છે.

