एजेंट कौशल में महत्वपूर्ण नवाचार! एंथ्रोपिक ने कौशल कारखाने को परमाणु स्तर के evals सिस्टम में अपग्रेड किया, डेवलपर्स: पुराने कौशल को पुनर्जीवित किया

3/9/2026
4 min read

एजेंट कौशल में महत्वपूर्ण नवाचार! एंथ्रोपिक ने कौशल कारखाने को परमाणु स्तर के evals सिस्टम में अपग्रेड किया, डेवलपर्स: पुराने कौशल को पुनर्जीवित किया

智猩猩AI整理 | 编辑:汐汐

AI स्मार्ट एजेंट के क्षेत्र में, यदि आपने एजेंट कौशल का उपयोग किया है, तो आप निश्चित रूप से skill-creator के बारे में जानते होंगे, जो एंथ्रोपिक द्वारा 2025 में जारी किया गया एक कौशल बिना कोड निर्माण उपकरण है।

लेकिन कौशल बनाने के बाद, यह जानना अभी भी संभव नहीं है कि यह कौशल उपयोगी है या नहीं, नया मॉडल काम करेगा या नहीं, यह सही ढंग से चलेगा या नहीं, और इसका प्रभाव कैसा है...

3 मार्च को, एंथ्रोपिक के आधिकारिक ब्लॉग ने चुपचाप एक महत्वपूर्ण अपडेट जारी किया, जिसका नाम है Improving skill-creator: Test, measure, and refine Agent Skills। इस अपग्रेड ने क्लॉड के "कौशल कारखाने" को वास्तव में परिपक्वता की ओर बढ़ाया।

"देखने में उपयोगी" से "परीक्षण योग्य, मापने योग्य, पुनरावृत्त करने योग्य" तक, इसने पहले कौशल लेखकों के सबसे बड़े दर्द बिंदु को पूरी तरह से हल कर दिया, यानी "मैंने जो कौशल बनाया है, वह वास्तव में उपयोगी है या नहीं?"

01 - एजेंट कौशल की समीक्षा: सामान्य सहायक से पेशेवर स्मार्ट एजेंट की ओर एक महत्वपूर्ण कदम

2025 में एंथ्रोपिक ने आधिकारिक रूप से एजेंट कौशल लॉन्च किया, जो एक मॉड्यूलर, पुन: उपयोग योग्य "कौशल पैक" प्रणाली है। एक फ़ोल्डर में SKILL.md निर्देश, स्क्रिप्ट, संसाधन होते हैं, क्लॉड आवश्यकतानुसार स्वचालित रूप से लोड करता है, दस्तावेज़ उत्पादन, डेटा विश्लेषण, ब्रांड अनुपालन आदि के दृश्य प्रदर्शन में काफी सुधार करता है।

कौशल ने क्लॉड.ai, क्लॉड कोड, API सभी प्लेटफार्मों को कवर किया है, और GitHub रिपॉजिटरी को खोला है (वर्तमान में स्टार्स 80,000 से अधिक हैं)। लेकिन प्रारंभिक संस्करण की सबसे बड़ी सीमा यह थी कि गैर-तकनीकी उपयोगकर्ता केवल अनुभव के आधार पर पुनरावृत्त कर सकते थे, प्रभाव को मात्रात्मक रूप से सत्यापित नहीं कर सकते थे।

कौशल की दो प्रकार हैं:

1. क्षमता वृद्धि प्रकार

मॉडल मूल रूप से "नहीं कर सकता" या "अस्थिर रूप से कर सकता" है, कौशल के माध्यम से विशिष्ट तकनीकें, पैटर्न डालकर आउटपुट को स्थिर किया जाता है।

2. प्राथमिकता कोडिंग प्रकार

मॉडल हर कदम कर सकता है, लेकिन इसे टीम की विशिष्ट प्रक्रिया के अनुसार सख्ती से क्रमबद्ध करने की आवश्यकता है।

इस अपग्रेड के 5 प्रमुख आकर्षण:

  • Evals (स्वचालित मूल्यांकन): उपयोगकर्ता केवल "परीक्षण संकेत + अपेक्षित आउटपुट का रूप" का वर्णन करते हैं, कौशल-निर्माता स्वचालित रूप से सत्यापन चलाता है।
  • बेंचमार्क मोड: मानकीकृत परीक्षणों को बैच में चलाना, पास दर, समय, टोकन खपत जैसे ठोस संकेतकों का उत्पादन करना।
  • कई एजेंटों का समानांतर निष्पादन: स्वतंत्र स्वच्छ संदर्भ, प्रदूषण से बचें, परीक्षण की गति में वृद्धि।
  • Comparator (अंधा परीक्षण तुलना): दो कौशल संस्करणों का A/B परीक्षण।
  • Description Tuning (ट्रिगर विवरण अनुकूलन): स्वचालित रूप से नमूना संकेतों का विश्लेषण करना, विवरण संशोधन का सुझाव देना।

02 - स्थापित करने का कोई कारण नहीं है! इस अपडेट ने पुराने कौशल को पुनर्जीवित किया

एंथ्रोपिक के कौशल-निर्माता के इस अपडेट ने तुरंत AI एजेंट पेशेवरों और डेवलपर्स के बीच चर्चा को जन्म दिया।

03 - AI स्मार्ट एजेंट का CI/CD क्षण: कला के टुकड़े से इंजीनियरिंग उत्पाद में परिवर्तन

एंथ्रोपिक के कौशल-निर्माता के इस अपग्रेड ने मूल रूप से सॉफ्टवेयर इंजीनियरिंग में सबसे परिपक्व "परीक्षण-मानक-रिपीट" चक्र को सामान्य उपयोगकर्ताओं और व्यावसायिक टीमों के लिए कम बाधा के साथ लाया है। इसका मतलब है कि एजेंट कौशल अब "लिखने के बाद फेंकने" वाला एक बार का प्रॉम्प्ट प्रोजेक्ट नहीं है, बल्कि इसे निरंतर बनाए रखा जा सकता है, मॉडल संस्करणों के बीच संगतता, डेटा-संचालित अनुकूलन के साथ "जीवित संपत्ति" है।

अल्पकालिक में, सबसे बड़े लाभार्थी वे डेवलपर्स और व्यावसायिक उपयोगकर्ता हैं जिन्होंने क्लॉड कोड / सहकर्मी में पहले से ही बड़ी संख्या में कस्टम कौशल जमा किए हैं।

और एक व्यापक दृष्टिकोण से, इस अपडेट ने एंथ्रोपिक के एजेंट पारिस्थितिकी में "उपकरण श्रृंखला की सुरक्षा" को और मजबूत किया है।

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy संशोधन गाइड: कैसे प्राप्त करें चमकदार किंवदंती स्तर का पालतू

Claude Code Buddy संशोधन गाइड: कैसे प्राप्त करें चमकदार किंवदंती स्तर का पालतू 2026年4月1日,Anthropic 在 Claude Code 2.1.89 ...

Obsidian ने Defuddle लॉन्च किया, Obsidian Web Clipper को एक नए स्तर पर ले गयाTechnology

Obsidian ने Defuddle लॉन्च किया, Obsidian Web Clipper को एक नए स्तर पर ले गया

Obsidian ने Defuddle लॉन्च किया, Obsidian Web Clipper को एक नए स्तर पर ले गया मैं हमेशा Obsidian के मूल विचार को पसंद क...

OpenAI अचानक घोषणा करता है "तीन-इन-एक": ब्राउज़र + प्रोग्रामिंग + ChatGPT का विलय, आंतरिक रूप से स्वीकार किया कि पिछले वर्ष गलत दिशा में बढ़ाTechnology

OpenAI अचानक घोषणा करता है "तीन-इन-एक": ब्राउज़र + प्रोग्रामिंग + ChatGPT का विलय, आंतरिक रूप से स्वीकार किया कि पिछले वर्ष गलत दिशा में बढ़ा

OpenAI अचानक घोषणा करता है "तीन-इन-एक": ब्राउज़र + प्रोग्रामिंग + ChatGPT का विलय, आंतरिक रूप से स्वीकार किया कि पिछले व...

2026, खुद को 'स्वायत्त' करने के लिए मजबूर नहीं! ये 8 छोटी बातें करें, स्वास्थ्य स्वाभाविक रूप से आएगाHealth

2026, खुद को 'स्वायत्त' करने के लिए मजबूर नहीं! ये 8 छोटी बातें करें, स्वास्थ्य स्वाभाविक रूप से आएगा

2026, खुद को 'स्वायत्त' करने के लिए मजबूर नहीं! ये 8 छोटी बातें करें, स्वास्थ्य स्वाभाविक रूप से आएगा नए साल की शुरुआत,...

वे माताएँ जो वजन कम करने की कोशिश कर रही हैं लेकिन सफल नहीं हो रही हैं, निश्चित रूप से यहाँ फंस गई हैंHealth

वे माताएँ जो वजन कम करने की कोशिश कर रही हैं लेकिन सफल नहीं हो रही हैं, निश्चित रूप से यहाँ फंस गई हैं

वे माताएँ जो वजन कम करने की कोशिश कर रही हैं लेकिन सफल नहीं हो रही हैं, निश्चित रूप से यहाँ फंस गई हैं मार्च का आधा मही...

📝
Technology

AI ब्राउज़र 24 घंटे स्थिर संचालन गाइड

AI ब्राउज़र 24 घंटे स्थिर संचालन गाइड यह ट्यूटोरियल एक स्थिर, दीर्घकालिक AI ब्राउज़र वातावरण स्थापित करने के तरीके को प्...