എജന്റ് സ്കിൽസ് വലിയ വിപ്ലവം! ആൻത്രോപിക് സ്കിൽ ഫാക്ടറി ആണവ ബോംബ്-ക്ലാസ് evals സിസ്റ്റത്തിൽ അപ്ഡേറ്റ് ചെയ്തു, ഡവലപ്പർ: പഴയ സ്കിൽസ് വീണ്ടും ജീവൻ കിട്ടുന്നു
എജന്റ് സ്കിൽസ് വലിയ വിപ്ലവം! ആൻത്രോപിക് സ്കിൽ ഫാക്ടറി ആണവ ബോംബ്-ക്ലാസ് evals സിസ്റ്റത്തിൽ അപ്ഡേറ്റ് ചെയ്തു, ഡവലപ്പർ: പഴയ സ്കിൽസ് വീണ്ടും ജീവൻ കിട്ടുന്നു
智猩猩AI整理 | 编辑:汐汐
AI ഇന്റലിജൻസ് ഏജന്റുകളുടെ മേഖലയിലെ, എജന്റ് സ്കിൽസ് ഉപയോഗിച്ചിട്ടുണ്ടെങ്കിൽ, ആൻത്രോപിക് 2025-ൽ പുറത്തിറക്കിയ skill-creator എന്ന ഈ skills ശൂന്യ-കോഡ് നിർമ്മാണ ഉപകരണത്തെ നിങ്ങൾക്കറിയാം.
എന്നാൽ skill നിർമ്മിച്ചതിന് ശേഷം, ഈ skill ഉപയോഗപ്രദമാണോ, പുതിയ മോഡൽ ഉപയോഗിക്കാമോ, പ്രവർത്തനം കൃത്യമായിട്ടുണ്ടോ, ഫലങ്ങൾ എങ്ങനെയാണെന്ന് അറിയാൻ കഴിയുന്നില്ല...
മാർച്ച് 3-ന്, ആൻത്രോപിക് ഔദ്യോഗിക ബ്ലോഗിൽ ഒരു വലിയ അപ്ഡേറ്റ് നിശ്ശബ്ദമായി പുറത്തിറങ്ങി, അത് Improving skill-creator: Test, measure, and refine Agent Skills എന്ന പേരിലാണ്. ഈ അപ്ഡേറ്റ് Claude-ന്റെ "സ്കിൽ ഫാക്ടറി" യാഥാർത്ഥ്യത്തിലേക്ക് എത്തിച്ചു.
"ഉപയോഗിക്കാൻ കഴിയുന്ന" എന്നതിൽ നിന്ന് "പരീക്ഷിക്കാൻ, അളക്കാൻ, ആവർത്തിക്കാൻ കഴിയുന്ന" എന്നതിലേക്ക്, മുമ്പത്തെ സ്കിൽ എഴുത്തുകാരുടെ ഏറ്റവും വലിയ വേദന, അതായത് "ഞാൻ നിർമ്മിച്ച സ്കിൽ എങ്ങനെ ഉപയോഗപ്രദമാണ്?" എന്നത് പൂർണ്ണമായും പരിഹരിച്ചു.
01 - എജന്റ് സ്കിൽസ് അവലോകനം: പൊതുവായ സഹായിയിൽ നിന്ന് പ്രൊഫഷണൽ ഇന്റലിജൻസിലേക്ക് ഒരു പ്രധാന ചുവടുവയ്പ്
2025-ൽ ആൻത്രോപിക് ഔദ്യോഗികമായി എജന്റ് സ്കിൽസ് അവതരിപ്പിച്ചു, ഇത് ഒരു മോഡുലാർ, പുനരുപയോഗിക്കാവുന്ന "സ്കിൽ പാക്ക്" സിസ്റ്റമാണ്. ഒരു ഫോൾഡറിൽ SKILL.md നിർദ്ദേശങ്ങൾ, സ്ക്രിപ്റ്റുകൾ, വിഭവങ്ങൾ ഉൾപ്പെടുന്നു, Claude ആവശ്യമായപ്പോൾ സ്വയം ലോഡ് ചെയ്യുന്നു, ഡോക്യുമെന്റ് നിർമ്മാണം, ഡാറ്റാ വിശകലനം, ബ്രാൻഡ് അനുകൂല്യം തുടങ്ങിയ രംഗങ്ങളിൽ പ്രകടനം വലിയ തോതിൽ മെച്ചപ്പെടുത്തുന്നു.
Skills Claude.ai, Claude Code, API മുഴുവൻ പ്ലാറ്റ്ഫോമുകളിലും ഉൾക്കൊള്ളുന്നു, കൂടാതെ GitHub സംഭരണി തുറന്നു (ഇപ്പോൾ 80,000-ൽ കൂടുതൽ സ്റ്റാർസ്). എന്നാൽ പ്രാരംഭ പതിപ്പിന്റെ ഏറ്റവും വലിയ പരിധി, സാങ്കേതിക ഉപയോക്താക്കൾക്ക് മാത്രം അനുഭവത്തിന്റെ അടിസ്ഥാനത്തിൽ ആവർത്തിക്കാൻ കഴിയുകയായിരുന്നുവെന്നും, ഫലങ്ങൾ അളക്കാൻ കഴിയുന്നില്ല.
Skills-ന്റെ രണ്ട് തരം:
1. കഴിവ് വർദ്ധനവിനായുള്ളത്
മോഡൽ "ചെയ്യാൻ കഴിയാത്ത" അല്ലെങ്കിൽ "അസ്ഥിരമായ" കാര്യങ്ങൾ, Skills-ൽ പ്രത്യേക നൈപുണ്യങ്ങൾ, മാതൃകകൾ ചേർത്ത് സ്ഥിരമായ ഔട്ട്പുട്ട് നൽകുന്നു.
2. ഇഷ്ടാനുസൃത കോഡിംഗ്
മോഡൽ ഓരോ ഘട്ടവും ചെയ്യാൻ കഴിയും, എന്നാൽ ടീം പ്രത്യേക പ്രക്രിയ അനുസരിച്ച് കർശനമായി ക്രമീകരിക്കേണ്ടതുണ്ട്.
ഈ അപ്ഡേറ്റിന്റെ 5 പ്രധാന പ്രത്യേകതകൾ:
- Evals (സ്വയമേവന വിലയിരുത്തൽ): ഉപയോക്താക്കൾക്ക് "പരീക്ഷണ പ്രോംപ്റ്റ് + പ്രതീക്ഷിക്കുന്ന ഔട്ട്പുട്ട്" വിവരണം നൽകേണ്ടതാണ്, skill-creator സ്വയം പ്രവർത്തനം സ്ഥിരീകരിക്കുന്നു.
- Benchmark മോഡ്: സ്റ്റാൻഡേർഡ് ടെസ്റ്റുകൾ ബാച്ച് നടത്തുന്നു, പാസ്സ് നിരക്ക്, സമയം, ടോക്കൺ ഉപഭോഗം തുടങ്ങിയ കഠിന സൂചികകൾ നൽകുന്നു.
- ബഹുജന ഏജന്റുകൾ സമാന്തരമായി പ്രവർത്തിക്കുന്നു: സ്വതന്ത്രമായ ശുദ്ധമായ പശ്ചാത്തലം, മലിനീകരണം ഒഴിവാക്കുന്നു, പരീക്ഷണ വേഗം വർദ്ധിക്കുന്നു.
- Comparator (മൂടൽമഞ്ഞ് പരിശോധന): A/B ടെസ്റ്റിംഗ് രണ്ട് സ്കിൽ പതിപ്പുകൾ.
- Description Tuning (പ്രേരണ വിവരണം മെച്ചപ്പെടുത്തൽ): സാമ്പിള് പ്രോംപ്റ്റുകൾ സ്വയം വിശകലനം ചെയ്യുന്നു, വിവരണം മാറ്റാൻ ശുപാർശ ചെയ്യുന്നു.
02 - ഇൻസ്റ്റാൾ ചെയ്യാൻ കാരണം ഇല്ല! ഈ അപ്ഡേറ്റ് പഴയ സ്കിൽസ് വീണ്ടും ജീവൻ നൽകുന്നു
ആൻത്രോപിക് skill-creator-ന്റെ ഈ അപ്ഡേറ്റ്, എഐ ഏജന്റ് മേഖലയിൽ പ്രവർത്തിക്കുന്നവരും ഡവലപ്പർമാരും വേഗത്തിൽ ചർച്ച ചെയ്യാൻ കാരണമായി.
03 - എഐ ഇന്റലിജൻസിന്റെ CI/CD നിമിഷം: കലാപ്രവർത്തനത്തിൽ നിന്ന് എഞ്ചിനീയറിംഗ് ഉൽപ്പന്നത്തിലേക്ക്
ആൻത്രോപിക് skill-creator-ന്റെ ഈ അപ്ഡേറ്റ്, സോഫ്റ്റ്വെയർ എഞ്ചിനീയറിംഗിൽ ഏറ്റവും പ്രായോഗികമായ "പരീക്ഷണം-ബഞ്ച്മാർക്ക്-അവതരണം" ക്ലോസ്-ലൂപ്പ്, സാധാരണ ഉപയോക്താക്കൾക്കും സ്ഥാപന ടീമുകൾക്കും കുറഞ്ഞ തടസ്സത്തിൽ എത്തിച്ചേർന്നു. ഇത് എജന്റ് സ്കിൽസ് "എഴുതി തള്ളുക" എന്ന തരം ഒരു തവണ ഉപയോഗിക്കുന്ന പ്രോംപ്റ്റ് എഞ്ചിനീയറിംഗ് അല്ല, മറിച്ച് തുടർച്ചയായി പരിപാലിക്കാവുന്ന, മോഡൽ പതിപ്പുകൾക്കിടയിൽ പൊരുത്തപ്പെടുന്ന, ഡാറ്റാ അടിസ്ഥാനത്തിൽ മെച്ചപ്പെടുത്താവുന്ന "ജീവിത ആസ്തി" ആകുന്നു.
ചുരുക്കത്തിൽ, ഏറ്റവും വലിയ പ്രയോജനം ലഭിക്കുന്നവരാണ് Claude Code / Cowork-ൽ വലിയ തോതിൽ ഇഷ്ടാനുസൃത സ്കിൽസ് സമാഹരിച്ച ഡവലപ്പർമാരും സ്ഥാപന ഉപയോക്താക്കളും.
എന്നാൽ കൂടുതൽ വ്യാപകമായ കാഴ്ചപ്പാടിൽ, ഈ അപ്ഡേറ്റ് ആൻത്രോപിക് എജന്റ് ഇക്കോസിസ്റ്റത്തിൽ "ഉപകരണ ശൃംഖലയുടെ കാവൽ" കൂടുതൽ ശക്തമാക്കുന്നു.

