एजंट कौशल्यांमध्ये मोठा बदल! Anthropic ने कौशल्य कारखाना आणला आण्विक स्तरावरील evals प्रणालीमध्ये, विकासक: जुने कौशल्य पुनर्जीवित
एजंट कौशल्यांमध्ये मोठा बदल! Anthropic ने कौशल्य कारखाना आणला आण्विक स्तरावरील evals प्रणालीमध्ये, विकासक: जुने कौशल्य पुनर्जीवित
智猩猩AI整理 | संपादक:汐汐
AI बुद्धिमत्ता क्षेत्रात, जर तुम्ही एजंट कौशल्यांचा वापर केला असेल, तर तुम्हाला नक्कीच skill-creator माहीत असेल, जो Anthropic ने 2025 मध्ये प्रकाशित केलेला एक कौशल्य शून्य कोड बांधणी साधन आहे.
परंतु कौशल्य तयार केल्यानंतर, हे कौशल्य उपयुक्त आहे का, नवीन मॉडेल वापरता येईल का, चालविण्यात अचूक आहे का, परिणाम कसे आहे हे अजूनही माहित नाही...
3 मार्च रोजी, Anthropic च्या अधिकृत ब्लॉगवर एक महत्त्वपूर्ण अद्यतन प्रकाशित झाले, ज्याचे नाव आहे Improving skill-creator: Test, measure, and refine Agent Skills. या अद्यतनामुळे Claude चा "कौशल्य कारखाना" खरोखरच प्रगल्भ झाला.
"वापरता येईल" पासून "चाचणी करता येईल, मोजता येईल, पुनरावृत्ती करता येईल" पर्यंत, यामुळे कौशल्य लेखकांचा सर्वात मोठा त्रास पूर्णपणे सोडवला, म्हणजे "मी तयार केलेले कौशल्य खरंच उपयुक्त आहे का?"
01 - एजंट कौशल्यांचा आढावा: सामान्य सहाय्यकापासून व्यावसायिक बुद्धिमत्तेच्या दिशेने एक महत्त्वाचा टप्पा
2025 मध्ये Anthropic ने अधिकृतपणे एजंट कौशल्ये सुरू केली, ही एक मॉड्यूलर, पुनर्वापरयोग्य "कौशल्य पॅक" प्रणाली आहे. एका फोल्डरमध्ये SKILL.md निर्देश, स्क्रिप्ट, संसाधने समाविष्ट आहेत, Claude आवश्यकतेनुसार स्वयंचलितपणे लोड करतो, दस्तऐवज निर्मिती, डेटा विश्लेषण, ब्रँड अनुपालन इत्यादी दृश्ये मोठ्या प्रमाणात सुधारतो.
कौशल्ये Claude.ai, Claude Code, API सर्व प्लॅटफॉर्मवर उपलब्ध आहेत आणि GitHub रेपॉजिटरी खुली आहे (सध्या 80,000 पेक्षा जास्त तारे आहेत). परंतु प्रारंभिक आवृत्तीची सर्वात मोठी मर्यादा म्हणजे, तांत्रिक नसलेल्या वापरकर्त्यांना फक्त भावना वापरून पुनरावृत्ती करणे शक्य होते, परिणामांचे प्रमाणित प्रमाणित करणे शक्य नव्हते.
कौशल्यांच्या दोन प्रकार:
1. क्षमता वाढवणारे
मॉडेल मूळतः "करू शकत नाही" किंवा "अस्थिरपणे करते" अशा गोष्टी, कौशल्यांद्वारे विशिष्ट कौशल्ये, पद्धतींचा समावेश करून स्थिरपणे आउटपुट करते.
2. प्राधान्य कोडिंग प्रकार
मॉडेल प्रत्येक पायरीवर करू शकते, परंतु टीमच्या विशिष्ट प्रक्रियेनुसार कठोरपणे क्रमवारी लावणे आवश्यक आहे.
या अद्यतनाचे 5 प्रमुख वैशिष्ट्ये:
- Evals (स्वयंचलित मूल्यांकन): वापरकर्त्यांना फक्त "चाचणी संकेतशब्द + अपेक्षित आउटपुट" वर्णन करणे आवश्यक आहे, skill-creator स्वयंचलितपणे सत्यापन चालवतो.
- Benchmark मोड: प्रमाणित चाचण्या चालवणे, पास दर, वेळ, टोकन वापर इत्यादी कठोर मापदंडांचे आउटपुट.
- बहु-एजंट समांतर कार्यान्वयन: स्वतंत्र स्वच्छ संदर्भ, प्रदूषण टाळणे, चाचणी गती वाढवणे.
- Comparator (अंध चाचणी तुलना): दोन कौशल्य आवृत्त्यांचे A/B चाचणी.
- Description Tuning (उत्तेजक वर्णन ऑप्टिमायझेशन): नमुना संकेतांचे स्वयंचलित विश्लेषण, वर्णन सुधारण्याची शिफारस.
02 - स्थापित करण्यासाठी काहीही कारण नाही! या अद्यतनामुळे जुने कौशल्य पुनर्जीवित झाले
Anthropic च्या skill-creator च्या या अद्यतनाने, AI एजंट व्यावसायिक आणि विकासकांमध्ये तात्काळ चर्चा सुरू केली.
03 - AI बुद्धिमत्तेचा CI/CD क्षण: कलाकृतीपासून अभियांत्रिकी उत्पादनात बदल
Anthropic च्या skill-creator च्या या अद्यतनामुळे, सॉफ्टवेअर अभियांत्रिकीमधील सर्वात प्रगल्भ "चाचणी-मानक-आवृत्ती" बंद लूप सामान्य वापरकर्त्यांना आणि व्यावसायिक टीमला कमी अडथळ्यात आणले आहे. याचा अर्थ एजंट कौशल्ये आता "लेखनानंतर फेकणे" एकदाच वापरण्यायोग्य प्रॉम्प्ट अभियांत्रिकी नाही, तर सतत देखभाल, क्रॉस मॉडेल आवृत्ती सुसंगतता, डेटा-आधारित ऑप्टिमायझेशनसाठी "जिवंत संपत्ती" आहे.
अल्पकालीन दृष्टिकोनातून, सर्वात मोठा लाभार्थी म्हणजे Claude Code / Cowork मध्ये मोठ्या प्रमाणात सानुकूल कौशल्ये जमा केलेले विकासक आणि व्यावसायिक वापरकर्ते.
आणि अधिक व्यापक दृष्टिकोनातून, या अद्यतनाने Anthropic च्या एजंट पारिस्थितिकी तंत्रातील "साधन शृंखला किल्ला" आणखी मजबूत केला.

