ایجنٹ اسکلز میں بڑی تبدیلی! اینتھروپک نے اسکل فیکٹری کو نیوکلیئر لیول evals سسٹم میں اپ گریڈ کیا، ڈویلپر: پرانی مہارتیں دوبارہ زندہ ہو گئیں
ایجنٹ اسکلز میں بڑی تبدیلی! اینتھروپک نے اسکل فیکٹری کو نیوکلیئر لیول evals سسٹم میں اپ گریڈ کیا، ڈویلپر: پرانی مہارتیں دوبارہ زندہ ہو گئیں
ذہین بندر AI کی ترتیب | ایڈیٹر: شِی شِی
AI ذہین ایجنٹ کے میدان میں، اگر آپ نے ایجنٹ اسکلز کا استعمال کیا ہے تو آپ یقینی طور پر skill-creator سے واقف ہوں گے، یہ ایک skills زیرو کوڈ تعمیراتی ٹول ہے جو اینتھروپک نے 2025 میں جاری کیا تھا۔
لیکن اسکل بنانے کے بعد، اب بھی یہ جاننے کا کوئی طریقہ نہیں ہے کہ یہ اسکل مفید ہے یا نہیں، کیا نیا ماڈل کام کرے گا، کیا یہ درست ہے، اور اس کا اثر کیسا ہے...
3 مارچ کو، اینتھروپک کی سرکاری بلاگ نے خاموشی سے ایک اہم اپ ڈیٹ جاری کی، جس کا نام ہے Improving skill-creator: Test, measure, and refine Agent Skills۔ یہ اپ گریڈ Claude کی "اسکل فیکٹری" کو حقیقت میں پختہ بنا دیتا ہے۔
"دیکھنے میں قابل استعمال" سے "قابل جانچ، قابل پیمائش، قابل تکرار" تک، اس نے پہلے کے اسکل مصنفین کے سب سے بڑے درد کے نقطے کو مکمل طور پر حل کر دیا، یعنی "میں نے جو اسکل بنائی ہے وہ واقعی مفید ہے؟"
01 - ایجنٹ اسکلز کا جائزہ: عمومی معاون سے پیشہ ور ذہین ایجنٹ کی طرف ایک اہم قدم
2025 میں اینتھروپک نے باقاعدہ طور پر ایجنٹ اسکلز متعارف کرایا، یہ ایک ماڈیولر، دوبارہ استعمال کے قابل "اسکل پیک" سسٹم ہے۔ ایک فولڈر میں SKILL.md ہدایات، اسکرپٹس، وسائل شامل ہیں، Claude ضرورت پڑنے پر خود بخود لوڈ کرتا ہے، دستاویزات کی تخلیق، ڈیٹا تجزیہ، برانڈ کی تعمیل وغیرہ کے منظرناموں کی کارکردگی کو نمایاں طور پر بڑھاتا ہے۔
Skills نے Claude.ai، Claude Code، API پوری پلیٹ فارم پر احاطہ کر لیا ہے، اور GitHub ریپوزٹری کھول دی ہے (فی الحال ستارے 80,000 سے زیادہ ہیں)۔ لیکن ابتدائی ورژن کی سب سے بڑی حد یہ تھی کہ غیر تکنیکی صارفین صرف احساس کی بنیاد پر تکرار کر سکتے تھے، اثرات کی مقدار کو جانچنے کی صلاحیت نہیں تھی۔
Skills کی دو اقسام ہیں:
1. صلاحیت بڑھانے والی
ماڈل جو "نہیں کر سکتا" یا "غیر مستحکم" کام ہے، اس میں Skills خاص مہارتیں، پیٹرن شامل کر کے مستحکم آؤٹ پٹ فراہم کرتی ہیں۔
2. ترجیح کوڈنگ
ماڈل ہر قدم پر کام کر سکتا ہے، لیکن اسے ٹیم کے مخصوص عمل کے مطابق سختی سے ترتیب دینا ضروری ہے۔
اس اپ گریڈ کی 5 بڑی خصوصیات:
- Evals (خودکار تشخیص): صارف کو صرف "ٹیسٹ پرامپٹ + متوقع آؤٹ پٹ کی شکل" بیان کرنے کی ضرورت ہے، skill-creator خودکار طور پر تصدیق کرتا ہے۔
- بینچ مارک موڈ: معیاری ٹیسٹ کو بیچ میں چلانا، پاسنگ ریٹ، وقت، ٹوکن کی کھپت وغیرہ جیسے سخت اشارے پیدا کرنا۔
- متعدد ایجنٹس کا متوازی عمل: آزاد صاف سیاق و سباق، آلودگی سے بچنا، ٹیسٹ کی رفتار میں زبردست اضافہ۔
- Comparator (بلا اندھی جانچ موازنہ): A/B ٹیسٹ دو اسکل ورژن۔
- Description Tuning (ٹرگر کی وضاحت کی اصلاح): نمونہ پرامپٹس کا خودکار تجزیہ، وضاحت میں تبدیلی کی تجویز دینا۔
02 - انسٹال کرنے کی کوئی وجہ نہیں! یہ اپ ڈیٹ پرانی مہارتوں کو دوبارہ زندہ کر دیتی ہے
اینٹھروپک کی skill-creator کے اس اپ ڈیٹ نے AI ایجنٹ کے پیشہ ور افراد اور ڈویلپرز میں فوری طور پر بحث و مباحثہ شروع کر دیا۔
03 - AI ذہین ایجنٹ کا CI/CD لمحہ: فن پارے سے انجینئرنگ مصنوعات میں تبدیلی
اینٹھروپک کی skill-creator میں یہ اپ گریڈ بنیادی طور پر سافٹ ویئر انجینئرنگ میں سب سے زیادہ ترقی یافتہ "ٹیسٹ-بینچ مارک-تکرار" بند لوپ کو عام صارفین اور کاروباری ٹیموں کے لیے کم درجہ کی سطح پر لاتا ہے۔ اس کا مطلب ہے کہ ایجنٹ اسکلز اب "لکھنے کے بعد پھینکنے" کی ایک بار استعمال ہونے والی پرامپٹ انجینئرنگ نہیں ہیں، بلکہ یہ مسلسل دیکھ بھال، کراس ماڈل ورژن کی مطابقت، اور ڈیٹا کی بنیاد پر بہتری کے "زندہ اثاثے" ہیں۔
قلیل مدتی میں، سب سے بڑا فائدہ اٹھانے والے وہ ڈویلپر اور کاروباری صارفین ہیں جنہوں نے پہلے ہی Claude Code / Cowork میں بڑی تعداد میں اپنی مرضی کی مہارتیں جمع کی ہیں۔
اور ایک وسیع تر نقطہ نظر سے، یہ اپ ڈیٹ مزید اینتھروپک کے ایجنٹ ماحولیاتی نظام میں "ٹول چین کی حفاظتی خندق" کو مستحکم کرتی ہے۔

