एजेंट कौशल में महत्वपूर्ण नवाचार: एंथ्रोपिक ने evals प्रणाली को अपग्रेड किया, पुराने कौशल को पुनर्जीवित किया (2026-03-09)
एजेंट कौशल में महत्वपूर्ण नवाचार! एंथ्रोपिक ने कौशल निर्माण में न्यूक्लियर-लेवल evals प्रणाली को अपग्रेड किया, डेवलपर्स: पुराने कौशल को पुनर्जीवित किया
智猩猩AI整理 | संपादक:汐汐
AI स्मार्ट एजेंट के क्षेत्र में, यदि आपने एजेंट कौशल का उपयोग किया है, तो आप निश्चित रूप से skill-creator के बारे में जानते होंगे, जो एंथ्रोपिक द्वारा 2025 में जारी किया गया एक कौशल बिना कोड निर्माण उपकरण है।
3 मार्च को, एंथ्रोपिक के आधिकारिक ब्लॉग ने महत्वपूर्ण अपडेट "कौशल-निर्माता में सुधार: एजेंट कौशल का परीक्षण, माप और परिष्कृत करें" जारी किया।
01 - एजेंट कौशल का पुनरावलोकन
2025 के अक्टूबर में एंथ्रोपिक ने आधिकारिक रूप से एजेंट कौशल लॉन्च किया, जो एक मॉड्यूलर, पुन: उपयोग योग्य कौशल पैकेज प्रणाली है।
इस अपग्रेड के 5 प्रमुख आकर्षण
- Evals (स्वचालित मूल्यांकन)
- बेंचमार्क मोड
- मल्टी-एजेंट समानांतर निष्पादन
- Comparator (ब्लाइंड टेस्ट तुलना)
- Description Tuning (ट्रिगर विवरण अनुकूलन)
02 - इंस्टॉल न करने का कोई कारण नहीं
एंथ्रोपिक के इस कौशल-निर्माता के अपडेट ने AI एजेंट पेशेवरों और डेवलपर्स के बीच तेजी से चर्चा शुरू कर दी।
03 - AI स्मार्ट एजेंट का CI/CD क्षण
एंथ्रोपिक के इस कौशल-निर्माता के अपग्रेड ने मूल रूप से सॉफ्टवेयर इंजीनियरिंग में सबसे परिपक्व परीक्षण-मानक-आवृत्ति चक्र को सामान्य उपयोगकर्ताओं और व्यावसायिक टीमों के लिए कम बाधाओं के साथ लाया है.

