ఏజెంట్ స్కిల్స్లో పెద్ద మార్పులు! ఆంత్రోపిక్ స్కిల్ ఫ్యాక్టరీని న్యూక్లియర్-గ్రేడ్ evals సిస్టమ్లో అద్దెకు తీసుకుంది, డెవలపర్: పాత స్కిల్స్ తిరిగి జీవితం పొందాయి
ఏజెంట్ స్కిల్స్లో పెద్ద మార్పులు! ఆంత్రోపిక్ స్కిల్ ఫ్యాక్టరీని న్యూక్లియర్-గ్రేడ్ evals సిస్టమ్లో అద్దెకు తీసుకుంది, డెవలపర్: పాత స్కిల్స్ తిరిగి జీవితం పొందాయి
జ్ఞానశక్తి AI సేకరణ | సంపాదకుడు: షి షి
AI ఇంటెలిజెంట్ ఏజెంట్ రంగంలో, మీరు ఏజెంట్ స్కిల్స్ను ఉపయోగించినట్లయితే, మీరు ఖచ్చితంగా స్కిల్-క్రియేటర్ను తెలుసుకుంటారు, ఇది ఆంత్రోపిక్ 2025లో విడుదల చేసిన ఒక స్కిల్స్ జీరో కోడ్ నిర్మాణ సాధనం.
కానీ స్కిల్ను నిర్మించిన తర్వాత, ఈ స్కిల్ ఉపయోగకరమా, కొత్త మోడల్ ఇంకా ఉపయోగించగలమా, నడుస్తున్నది ఖచ్చితమా, ఫలితం ఎలా ఉంది అనే విషయాలు తెలియడం లేదు...
మార్చి 3న, ఆంత్రోపిక్ అధికారిక బ్లాగ్ నిశ్శబ్దంగా ఒక భారీ నవీకరణను విడుదల చేసింది, దీనిని "Improving skill-creator: Test, measure, and refine Agent Skills" అని పిలుస్తారు. ఈ నవీకరణ Claude యొక్క "స్కిల్ ఫ్యాక్టరీ"ని నిజంగా పరిపక్వతకు తీసుకువెళ్లింది.
"చూడటానికి ఉపయోగకరంగా" నుండి "పరీక్షించదగినది, కొలవదగినది, పునరావృతమయ్యే" దశకు, గతంలో స్కిల్ రచయితల అత్యంత బాధాకరమైన సమస్యను పూర్తిగా పరిష్కరించింది, అంటే "నేను చేసిన స్కిల్ నిజంగా ఉపయోగకరమా?"
01 - ఏజెంట్ స్కిల్స్ సమీక్ష: సాధారణ సహాయకుడి నుండి ప్రత్యేక ఇంటెలిజెంట్ ఏజెంట్కు కీలకమైన అడుగు
2025 అక్టోబర్లో ఆంత్రోపిక్ అధికారికంగా ఏజెంట్ స్కిల్స్ను విడుదల చేసింది, ఇది ఒక మాడ్యూలర్, పునఃఉపయోగించదగిన "స్కిల్ ప్యాక్" వ్యవస్థ. ఒక ఫోల్డర్లో SKILL.md ఆదేశాలు, స్క్రిప్ట్లు, వనరులు ఉన్నాయి, Claude అవసరమైనప్పుడు ఆటోమేటిక్గా లోడ్ చేస్తుంది, డాక్యుమెంట్ ఉత్పత్తి, డేటా విశ్లేషణ, బ్రాండ్ అనుకూలత వంటి దృశ్య ప్రదర్శనను భారీగా పెంచుతుంది.
స్కిల్స్ Claude.ai, Claude కోడ్, API మొత్తం ప్లాట్ఫారమ్ను కవర్ చేస్తుంది మరియు GitHub గిడ్డంగిని (ప్రస్తుతం 80,000 పైగా స్టార్లు) తెరిచింది. కానీ ప్రారంభ సంస్కరణల అత్యంత పరిమితి ఏమిటంటే, సాంకేతిక వినియోగదారులు కేవలం అనుభూతి ఆధారంగా పునరావృతం చేయగలరు, ఫలితాలను కొలవడం సాధ్యం కాదు.
స్కిల్స్కు రెండు రకాలున్నాయి:
1. సామర్థ్య పెంపు రకం
మోడల్ అసలు "చేయలేని" లేదా "అస్థిరంగా చేయలేని" విషయాలను, స్కిల్స్ ద్వారా ప్రత్యేక నైపుణ్యాలు, నమూనాలను చేర్చడం ద్వారా స్థిరంగా ఉత్పత్తి చేయడం.
2. ఇష్టానుసారం కోడింగ్ రకం
మోడల్ ప్రతి దశను చేయగలదు, కానీ టీమ్ ప్రత్యేక ప్రక్రియను కఠినంగా క్రమబద్ధీకరించాలి.
ఈ నవీకరణ యొక్క 5 ప్రధాన ఆకర్షణలు:
- Evals (ఆటోమేటెడ్ అంచనాలు): వినియోగదారులు కేవలం "పరీక్షా సూచన + ఆశించిన ఫలితాన్ని" వర్ణించాలి, స్కిల్-క్రియేటర్ ఆటోమేటిక్గా నిర్ధారణను నడుపుతుంది.
- బెంచ్మార్క్ మోడల్: ప్రమాణీకరించిన పరీక్షలను బాచ్లో నడుపుతుంది, పాస్ రేటు, సమయం, టోకెన్ వినియోగం వంటి కఠిన సూచికలను ఉత్పత్తి చేస్తుంది.
- బహుళ ఏజెంట్ల సమాంతర అమలు: స్వతంత్ర శుభ్రమైన సందర్భం, కాలుష్యాన్ని నివారిస్తుంది, పరీక్ష వేగం పెరుగుతుంది.
- కంపారేటర్ (మూడు పరీక్షా పోలిక): A/B పరీక్ష రెండు స్కిల్ సంస్కరణలు.
- వివరణ ట్యూనింగ్ (ప్రేరణ వివరణ ఆప్టిమైజేషన్): నమూనా సూచనలను ఆటోమేటిక్గా విశ్లేషిస్తుంది, వివరణను సవరించడానికి సిఫారసు చేస్తుంది.
02 - ఇన్స్టాల్ చేయడానికి కారణం లేదు! ఈ నవీకరణ పాత స్కిల్స్ను తిరిగి జీవితం పొందిస్తుంది
ఆంత్రోపిక్ స్కిల్-క్రియేటర్కు ఈ నవీకరణ, త్వరగా AI ఏజెంట్ రంగంలో నిపుణులు మరియు డెవలపర్ల మధ్య చర్చను ప్రేరేపించింది.
03 - AI ఇంటెలిజెంట్ ఏజెంట్ యొక్క CI/CD క్షణం: కళాఖండం నుండి ఇంజనీరింగ్ ఉత్పత్తిగా మారింది
ఆంత్రోపిక్ ఈసారి స్కిల్-క్రియేటర్ను నవీకరించడం, సాఫ్ట్వేర్ ఇంజనీరింగ్లో అత్యంత పరిపక్వమైన "పరీక్ష-బెంచ్మార్క్-పునరావృతం" మూలకాన్ని సాధారణ వినియోగదారులకు మరియు సంస్థల బృందాలకు తక్కువ అడ్డంకులతో అందించింది. ఇది ఏజెంట్ స్కిల్స్ ఇక "రాసి విసిరేయడం" అనే ఒకసారి ఉపయోగించే ప్రాంప్ట్ ఇంజనీరింగ్ కాదు, కానీ నిరంతరం నిర్వహించగల, మోడల్ సంస్కరణల మధ్య అనుకూలంగా ఉండగల, డేటా ఆధారిత ఆప్టిమైజేషన్ చేయగల "జీవిత ఆస్తి".
చిన్న కాలంలో, అత్యంత లాభదాయకులు Claude కోడ్ / కో-వర్క్లో భారీగా కస్టమైజ్ చేసిన స్కిల్స్ను సేకరించిన డెవలపర్లు మరియు సంస్థ వినియోగదారులు.
మరియు మరింత విస్తృతమైన దృష్టిలో, ఈ నవీకరణ ఆంత్రోపిక్ను ఏజెంట్ పర్యావరణంలో "సాధనాల గొలుసు కట్టె"ని మరింత బలంగా చేసింది.

