Kỹ Năng Đại Lý Đột Phá Lớn! Anthropic Nâng Cấp Nhà Máy Kỹ Năng Nhét Vào Hệ Thống Evals Cấp Hạt Nhân, Nhà Phát Triển: Kỹ Năng Cũ Được Hồi Sinh

3/9/2026
5 min read

Kỹ Năng Đại Lý Đột Phá Lớn! Anthropic Nâng Cấp Nhà Máy Kỹ Năng Nhét Vào Hệ Thống Evals Cấp Hạt Nhân, Nhà Phát Triển: Kỹ Năng Cũ Được Hồi Sinh

智猩猩AI整理 | 编辑:汐汐

Trong lĩnh vực AI thông minh, nếu bạn đã từng sử dụng Kỹ Năng Đại Lý, chắc chắn bạn sẽ biết đến skill-creator, một công cụ xây dựng kỹ năng không cần mã được Anthropic phát hành vào năm 2025.

Tuy nhiên, sau khi xây dựng xong kỹ năng, vẫn không biết kỹ năng này có hữu ích hay không, mô hình mới có còn sử dụng được không, chạy có chính xác không, hiệu quả như thế nào...

Vào ngày 3 tháng 3, blog chính thức của Anthropic đã âm thầm phát hành một bản cập nhật quan trọng, mang tên Cải Thiện skill-creator: Kiểm Tra, Đo Lường và Tinh Chỉnh Kỹ Năng Đại Lý. Bản nâng cấp này đã thực sự đưa "nhà máy kỹ năng" của Claude tiến đến độ trưởng thành.

Từ "trông có vẻ hữu ích" đến "có thể kiểm tra, có thể đo lường, có thể lặp lại", đã hoàn toàn giải quyết được nỗi đau lớn nhất của các tác giả kỹ năng trước đây, đó là "kỹ năng tôi làm ra có thực sự hữu ích không?"

01 - Nhìn Lại Kỹ Năng Đại Lý: Bước Quan Trọng Từ Trợ Lý Chung Sang Thông Minh Chuyên Nghiệp

Vào tháng 10 năm 2025, Anthropic chính thức ra mắt Kỹ Năng Đại Lý, đây là một hệ thống "gói kỹ năng" có thể tái sử dụng và mô-đun. Một thư mục chứa các chỉ thị SKILL.md, kịch bản, tài nguyên, Claude sẽ tự động tải khi cần, nâng cao đáng kể hiệu suất trong việc tạo tài liệu, phân tích dữ liệu, tuân thủ thương hiệu và các tình huống khác.

Kỹ năng đã bao phủ toàn bộ nền tảng Claude.ai, Claude Code, API và mở kho GitHub (hiện tại có hơn 80.000 sao). Nhưng giới hạn lớn nhất của phiên bản đầu tiên là, người dùng không kỹ thuật chỉ có thể lặp lại dựa trên cảm giác, không thể xác thực hiệu quả một cách định lượng.

Kỹ Năng có hai loại:

1. Loại Tăng Cường Năng Lực

Những việc mà mô hình ban đầu "không thể làm" hoặc "làm không ổn định", thông qua Kỹ Năng sẽ được tiêm vào các kỹ thuật, mô hình cụ thể để ổn định đầu ra.

2. Loại Mã Hóa Sở Thích

Mô hình có thể thực hiện từng bước, nhưng cần phải sắp xếp theo quy trình cụ thể của nhóm một cách nghiêm ngặt.

5 Điểm Nổi Bật Của Bản Nâng Cấp Này:

  • Evals (Đánh Giá Tự Động): Người dùng chỉ cần mô tả "câu lệnh kiểm tra + hình thức đầu ra mong đợi" skill-creator sẽ tự động chạy xác thực.
  • Chế Độ Benchmark: Chạy hàng loạt các bài kiểm tra tiêu chuẩn, xuất ra tỷ lệ vượt qua, thời gian tiêu tốn, tiêu thụ Token và các chỉ số cứng khác.
  • Thực Thi Song Song Nhiều Đại Lý: Bối cảnh độc lập sạch sẽ, tránh ô nhiễm, tốc độ kiểm tra tăng vọt.
  • Comparator (So Sánh Mù): Kiểm tra A/B hai phiên bản kỹ năng.
  • Description Tuning (Tối Ưu Mô Tả Kích Hoạt): Tự động phân tích mẫu câu lệnh, đề xuất sửa đổi mô tả.

02 - Không Có Lý Do Nào Để Không Cài Đặt! Bản Cập Nhật Này Khiến Kỹ Năng Cũ Hồi Sinh

Bản cập nhật này của Anthropic đối với skill-creator đã nhanh chóng thu hút sự bàn luận sôi nổi từ các chuyên gia và nhà phát triển AI Agent.

03 - Thời Điểm CI/CD Của AI Thông Minh: Từ Tác Phẩm Nghệ Thuật Trở Thành Sản Phẩm Kỹ Thuật

Bản nâng cấp này của Anthropic đối với skill-creator, về bản chất, đã mang đến cho người dùng bình thường và các nhóm doanh nghiệp một chu trình "kiểm tra - chuẩn hóa - lặp lại" đã trưởng thành nhất trong kỹ thuật phần mềm với mức độ thấp. Điều này có nghĩa là Kỹ Năng Đại Lý không còn là một kỹ thuật prompt một lần "viết xong thì vứt đi", mà là một "tài sản sống" có thể duy trì liên tục, tương thích qua các phiên bản mô hình và có thể tối ưu hóa dữ liệu.

Trong ngắn hạn, những người hưởng lợi lớn nhất là các nhà phát triển và người dùng doanh nghiệp đã tích lũy được nhiều kỹ năng tùy chỉnh trong Claude Code / Cowork.

Nhìn từ một góc độ vĩ mô hơn, bản cập nhật này đã củng cố thêm "vành đai bảo vệ chuỗi công cụ" của Anthropic trong hệ sinh thái Đại Lý.

Published in Technology

You Might Also Like

📝
Technology

Hướng dẫn chỉnh sửa Claude Code Buddy: Cách nhận thú cưng huyền thoại phát sáng

Hướng dẫn chỉnh sửa Claude Code Buddy: Cách nhận thú cưng huyền thoại phát sáng Ngày 1 tháng 4 năm 2026, Anthropic đã âm...

Obsidian đã ra mắt Defuddle, đưa Obsidian Web Clipper lên một tầm cao mớiTechnology

Obsidian đã ra mắt Defuddle, đưa Obsidian Web Clipper lên một tầm cao mới

Obsidian đã ra mắt Defuddle, đưa Obsidian Web Clipper lên một tầm cao mới Tôi luôn rất thích triết lý cốt lõi của Obsid...

OpenAI đột ngột công bố "ba trong một": Trình duyệt + lập trình + ChatGPT hợp nhất, nội bộ thừa nhận đã đi sai đường trong năm quaTechnology

OpenAI đột ngột công bố "ba trong một": Trình duyệt + lập trình + ChatGPT hợp nhất, nội bộ thừa nhận đã đi sai đường trong năm qua

OpenAI đột ngột công bố "ba trong một": Trình duyệt + lập trình + ChatGPT hợp nhất, nội bộ thừa nhận đã đi sai đường tro...

2026, không còn ép bản thân 'kỷ luật'! Làm tốt 8 việc nhỏ này, sức khỏe tự nhiên đếnHealth

2026, không còn ép bản thân 'kỷ luật'! Làm tốt 8 việc nhỏ này, sức khỏe tự nhiên đến

2026, không còn ép bản thân 'kỷ luật'! Làm tốt 8 việc nhỏ này, sức khỏe tự nhiên đến Năm mới bắt đầu, năm ngoái bạn đã ...

Những bà mẹ cố gắng giảm cân nhưng không thành công, chắc chắn đều mắc phải điều nàyHealth

Những bà mẹ cố gắng giảm cân nhưng không thành công, chắc chắn đều mắc phải điều này

Những bà mẹ cố gắng giảm cân nhưng không thành công, chắc chắn đều mắc phải điều này Tháng Ba đã qua nửa, kế hoạch giảm...

📝
Technology

Hướng dẫn vận hành ổn định AI Browser 24 giờ

Hướng dẫn vận hành ổn định AI Browser 24 giờ Bài hướng dẫn này giới thiệu cách thiết lập một môi trường AI Browser ổn đị...