Μεγάλη καινοτομία στις Δεξιότητες Πράκτορα! Η Anthropic αναβαθμίζει το εργοστάσιο δεξιοτήτων με το σύστημα evals επιπέδου πυρηνικής βόμβας, προγραμματιστές: οι παλιές δεξιότητες ανασταίνονται

智猩猩AI整理 | 编辑：汐汐

Στον τομέα των AI πρακτόρων, αν έχετε χρησιμοποιήσει τις Δεξιότητες Πράκτορα, σίγουρα θα γνωρίζετε το skill-creator, αυτό το εργαλείο χωρίς κώδικα για τη δημιουργία δεξιοτήτων που κυκλοφόρησε η Anthropic το 2025.

Ωστόσο, αφού δημιουργηθεί μια δεξιότητα, παραμένει αβέβαιο αν αυτή η δεξιότητα είναι χρήσιμη, αν το νέο μοντέλο μπορεί να χρησιμοποιηθεί, αν λειτουργεί σωστά, και ποια είναι τα αποτελέσματα...

Στις 3 Μαρτίου, το επίσημο blog της Anthropic δημοσίευσε ήσυχα μια σημαντική ενημέρωση, με τίτλο "Βελτίωση του skill-creator: Δοκιμή, μέτρηση και βελτίωση των Δεξιοτήτων Πράκτορα". Αυτή η αναβάθμιση έκανε το "εργοστάσιο δεξιοτήτων" του Claude να ωριμάσει πραγματικά.

Από το "φαίνεται ότι μπορεί να χρησιμοποιηθεί" στο "μπορεί να δοκιμαστεί, να μετρηθεί και να επαναληφθεί", επιλύθηκε πλήρως το μεγαλύτερο πρόβλημα των συγγραφέων δεξιοτήτων, δηλαδή "είναι οι δεξιότητες που δημιούργησα πραγματικά χρήσιμες;"

01 - Ανασκόπηση Δεξιοτήτων Πράκτορα: Ένα κρίσιμο βήμα από τον γενικό βοηθό στον επαγγελματία πράκτορα

Το 2025, η Anthropic παρουσίασε επίσημα τις Δεξιότητες Πράκτορα, ένα σύστημα "πακέτων δεξιοτήτων" που είναι αρθρωτό και επαναχρησιμοποιήσιμο. Ένας φάκελος περιέχει οδηγίες SKILL.md, σενάρια και πόρους, και ο Claude τα φορτώνει αυτόματα όταν χρειάζεται, βελτιώνοντας σημαντικά την απόδοση σε σενάρια όπως η δημιουργία εγγράφων, η ανάλυση δεδομένων και η συμμόρφωση με το εμπορικό σήμα.

Οι Δεξιότητες καλύπτουν όλη την πλατφόρμα Claude.ai, Claude Code, API και έχουν ανοίξει αποθετήριο GitHub (με περισσότερα από 80.000 αστέρια αυτή τη στιγμή). Ωστόσο, ο μεγαλύτερος περιορισμός των πρώιμων εκδόσεων ήταν ότι οι μη τεχνικοί χρήστες μπορούσαν να επαναλαμβάνουν μόνο με βάση την αίσθηση, χωρίς να μπορούν να ποσοτικοποιήσουν την αποτελεσματικότητα.

Υπάρχουν δύο τύποι Δεξιοτήτων:

1. Τύπος ενίσχυσης ικανοτήτων

Πράγματα που το μοντέλο "δεν μπορούσε" ή "δεν ήταν σταθερό" να κάνει, σταθεροποιούνται μέσω της εισαγωγής συγκεκριμένων τεχνικών και προτύπων μέσω των Δεξιοτήτων.

2. Τύπος κωδικοποίησης προτιμήσεων

Το μοντέλο μπορεί να κάνει κάθε βήμα, αλλά χρειάζεται αυστηρή σειρά σύμφωνα με τις συγκεκριμένες διαδικασίες της ομάδας.

5 κύρια σημεία της αναβάθμισης:

Evals (αυτοματοποιημένη αξιολόγηση): Οι χρήστες απλώς περιγράφουν "δοκιμαστική προτροπή + αναμενόμενη έξοδο" και το skill-creator εκτελεί αυτόματα την επαλήθευση.
Benchmark mode: Εκτελεί μαζικές τυποποιημένες δοκιμές, εξάγοντας σκληρούς δείκτες όπως ποσοστά επιτυχίας, χρόνος εκτέλεσης και κατανάλωση Token.
Παράλληλη εκτέλεση πολλών πρακτόρων: Ανεξάρτητο καθαρό πλαίσιο, αποφυγή μόλυνσης, ταχύτητα δοκιμών εκτοξεύεται.
Comparator (τυφλή σύγκριση): A/B δοκιμή δύο εκδόσεων δεξιοτήτων.
Description Tuning (βελτιστοποίηση περιγραφής): Αυτόματη ανάλυση δειγματοληπτικών προτροπών, προτάσεις για τροποποίηση περιγραφής.

02 - Δεν υπάρχει λόγος να μην εγκατασταθεί! Αυτή η αναβάθμιση ανασταίνει τις παλιές δεξιότητες

Η αναβάθμιση του skill-creator από την Anthropic προκάλεσε γρήγορα συζητήσεις μεταξύ επαγγελματιών και προγραμματιστών AI πρακτόρων.

03 - Η στιγμή CI/CD για τους AI πράκτορες: Από έργα τέχνης σε προϊόντα μηχανικής

Η αναβάθμιση του skill-creator από την Anthropic είναι ουσιαστικά η μεταφορά του πιο ώριμου κύκλου "δοκιμή-βάθμισμα-επανάληψη" της μηχανικής λογισμικού σε κατώφλι για κανονικούς χρήστες και ομάδες επιχειρήσεων. Αυτό σημαίνει ότι οι Δεξιότητες Πράκτορα δεν είναι πλέον "μια φορά και πετάω" έργα προτροπών, αλλά "ζωντανά περιουσιακά στοιχεία" που μπορούν να συντηρηθούν συνεχώς, να είναι συμβατά μεταξύ εκδόσεων μοντέλων και να βελτιστοποιούνται με δεδομένα.

Βραχυπρόθεσμα, οι μεγαλύτεροι ωφελημένοι είναι οι προγραμματιστές και οι επιχειρηματικοί χρήστες που έχουν ήδη συγκεντρώσει πολλές προσαρμοσμένες δεξιότητες στο Claude Code / Cowork.

Και με μια πιο μακροπρόθεσμη προοπτική, αυτή η αναβάθμιση ενισχύει περαιτέρω την "αμυντική γραμμή εργαλείων" της Anthropic στο οικοσύστημα Πράκτορα.

01 - Ανασκόπηση Δεξιοτήτων Πράκτορα: Ένα κρίσιμο βήμα από τον γενικό βοηθό στον επαγγελματία πράκτορα

Υπάρχουν δύο τύποι Δεξιοτήτων:

1. Τύπος ενίσχυσης ικανοτήτων

2. Τύπος κωδικοποίησης προτιμήσεων

5 κύρια σημεία της αναβάθμισης:

02 - Δεν υπάρχει λόγος να μην εγκατασταθεί! Αυτή η αναβάθμιση ανασταίνει τις παλιές δεξιότητες

03 - Η στιγμή CI/CD για τους AI πράκτορες: Από έργα τέχνης σε προϊόντα μηχανικής

You Might Also Like

Claude Code Buddy 修改指南：如何获得闪光传说级宠物

Obsidian παρουσίασε το Defuddle, ανεβάζοντας το Obsidian Web Clipper σε νέο επίπεδο

OpenAI ξαφνικά ανακοινώνει "τρίο σε ένα": Συνδυασμός περιηγητή + προγραμματισμού + ChatGPT, παραδέχεται ότι έκανε λάθος τον τελευταίο χρόνο

2026, μην πιέζεις τον εαυτό σου να είναι "πειθαρχημένος"! Κάνε αυτές τις 8 μικρές κινήσεις και η υγεία θα έρθει φυσικά

Οι μητέρες που προσπαθούν να χάσουν βάρος αλλά δεν τα καταφέρνουν, σίγουρα έχουν κολλήσει εδώ

AI Browser 24小时稳定运行指南