OpenClaw + Claude Code 超强教程:一个人就能搭建完整的开发团队!
OpenClaw + Claude Code 超强教程:一个 người có thể xây dựng một đội ngũ phát triển hoàn chỉnh!
Hôm nay chia sẻ một trường hợp thực hành rất ấn tượng. (Hướng dẫn ở cuối bài)
Một nhà phát triển độc lập, sử dụng OpenClaw + Codex/CC đã xây dựng một hệ thống AI Agent, đạt được hiệu quả gì?
Một ngày 94 lần gửi mã, hoàn thành 7 PR trong 30 phút, và trong ngày đó anh ta còn tổ chức 3 cuộc họp với khách hàng, mà chưa mở trình soạn thảo lần nào.
Đây là sự việc thực tế xảy ra vào tháng 1 năm 2026. Tác giả đã công khai toàn bộ kiến trúc hệ thống, quy trình làm việc, cấu hình mã, xem xong cảm thấy cách làm này rất đáng học hỏi, vì vậy đã tổng hợp thành bài viết này để chia sẻ với bạn.
Nếu bạn cũng đang sử dụng Codex hoặc Claude Code, hoặc quan tâm đến OpenClaw, bài viết này sẽ mang lại cho bạn nhiều cảm hứng.
Một người, một ngày 94 lần gửi mã
Trước tiên hãy xem một vài số liệu, cảm nhận sức mạnh của hệ thống này:
- Số lần gửi mã cao nhất trong một ngày là 94 lần (trung bình mỗi ngày 50 lần gửi mã)
- Hoàn thành 7 PR trong 30 phút
- Tốc độ từ ý tưởng đến triển khai nhanh đến mức có thể "giao hàng theo yêu cầu của khách hàng trong ngày"
Chi phí thì sao? Mỗi tháng $190 (Claude $100 + Codex $90), người mới bắt đầu chỉ cần $20 là có thể hoạt động.
Bạn có thể hỏi: Điều này có phải là tích hợp một đống công cụ AI, rồi điên cuồng tạo ra mã rác không?
Không phải. Lịch sử Git của tác giả trông giống như "vừa mới tuyển một đội ngũ phát triển", nhưng thực tế chỉ có một mình anh ta. Sự thay đổi quan trọng là: anh ấy đã từ "quản lý Claude Code" chuyển thành "quản lý một AI quản gia, mà quản gia đó lại quản lý một nhóm Claude Code".
- Trước tháng 1: trực tiếp sử dụng Codex hoặc Claude Code để viết mã
- Sau tháng 1: sử dụng OpenClaw làm lớp điều phối, để nó điều phối Codex/Claude Code/Gemini
Tại sao sử dụng Codex và Claude Code riêng lẻ không đủ tốt?
Lúc này, bạn có thể nghĩ: Codex và Claude Code đã rất mạnh rồi, tại sao còn cần thêm một lớp điều phối?
Câu trả lời của tác giả rất trực tiếp: Codex và Claude Code gần như không biết gì về doanh nghiệp của bạn. Chúng chỉ nhìn thấy mã, không thấy bức tranh toàn cảnh của doanh nghiệp.
Có một hạn chế cơ bản ở đây: cửa sổ ngữ cảnh là cố định, bạn chỉ có thể chọn một trong hai.
Bạn phải lựa chọn xem nên nhét gì vào bên trong:
- Nhét đầy mã → không còn chỗ cho ngữ cảnh doanh nghiệp
- Nhét đầy lịch sử khách hàng → không còn chỗ cho kho mã
- Nó không biết chức năng này dành cho khách hàng nào
- Nó không biết tại sao yêu cầu tương tự lần trước lại thất bại
- Nó không biết định vị sản phẩm và nguyên tắc thiết kế của bạn
- Nó chỉ có thể làm việc dựa trên mã hiện tại và prompt của bạn
Nó đóng vai trò là lớp điều phối, nằm giữa bạn và tất cả các công cụ AI. Vai trò của nó là:
- Nắm giữ tất cả ngữ cảnh doanh nghiệp (dữ liệu khách hàng, biên bản cuộc họp, quyết định lịch sử, các trường hợp thành công/thất bại)
- Dịch ngữ cảnh doanh nghiệp thành prompt chính xác, cung cấp cho các Agent cụ thể
- Để các Agent tập trung vào việc làm những gì chúng giỏi: viết mã
- Codex/Claude Code = đầu bếp chuyên nghiệp, chỉ lo nấu ăn
- OpenClaw = bếp trưởng, biết khẩu vị của khách hàng, tồn kho nguyên liệu, định vị thực đơn, đưa ra chỉ thị chính xác cho từng đầu bếp
Kiến trúc cụ thể của hệ thống hai lớp: lớp điều phối + lớp thực thi
Hãy xem kiến trúc cụ thể của hệ thống này.
Hai lớp, mỗi lớp đảm nhận một nhiệm vụ:
OpenClaw(Lớp điều phối)có thể làm gì?
- Đọc tất cả biên bản cuộc họp trong ghi chú Obsidian (đồng bộ tự động)
- Truy cập cơ sở dữ liệu sản xuất (quyền chỉ đọc) để lấy cấu hình khách hàng
- Có quyền API quản trị viên, có thể nạp tiền cho khách hàng và gỡ bỏ chặn
- Chọn đại lý phù hợp dựa trên loại nhiệm vụ
- Giám sát tiến độ của tất cả các đại lý, nếu thất bại sẽ phân tích nguyên nhân và điều chỉnh prompt để thử lại
- Thông báo cho tác giả qua Telegram khi hoàn thành
Agent(Lớp thực thi)có thể làm gì?
- Đọc và ghi vào kho mã
- Chạy thử nghiệm và xây dựng
- Gửi mã và tạo PR
- Phản hồi lại ý kiến từ code review
Thiết kế này rất thông minh: ranh giới an toàn rõ ràng, đồng thời đảm bảo hiệu quả.
Quy trình làm việc hoàn chỉnh: 8 bước từ yêu cầu của khách hàng đến hợp nhất PR
Bây giờ chúng ta sẽ đi vào phần cốt lõi. Sử dụng một trường hợp thực tế của tác giả vào tuần trước, tôi sẽ dẫn bạn qua quy trình hoàn chỉnh.
Bối cảnh: Một khách hàng doanh nghiệp gọi điện, nói rằng họ muốn tái sử dụng các cài đặt đã được cấu hình của họ và chia sẻ trong đội ngũ.
Bước 1: Yêu cầu của khách hàng → OpenClaw hiểu và phân tích
Sau khi cuộc gọi kết thúc, tác giả và Zoe (OpenClaw của anh ấy) đã thảo luận về yêu cầu này.
Điều kỳ diệu ở đây: không có chi phí giải thích. Bởi vì tất cả biên bản cuộc họp được đồng bộ tự động vào Obsidian, Zoe đã đọc nội dung cuộc gọi và biết khách hàng là ai, bối cảnh kinh doanh của họ, cấu hình hiện có.
Tác giả và Zoe cùng nhau phân tích yêu cầu thành: tạo một hệ thống mẫu, cho phép người dùng lưu và chỉnh sửa cấu hình hiện có.
Sau đó, Zoe đã thực hiện ba việc:
- Nạp tiền cho khách hàng — Sử dụng API quản trị viên để ngay lập tức gỡ bỏ hạn chế sử dụng của khách hàng
- Kéo cấu hình của khách hàng — Lấy cài đặt hiện có của khách hàng từ cơ sở dữ liệu sản xuất (chỉ đọc)
- Tạo prompt và khởi động đại lý — Đóng gói tất cả bối cảnh và cung cấp cho Codex
Bước 2: Khởi động đại lý
Zoe đã tạo cho nhiệm vụ này:
- Một git worktree độc lập (môi trường nhánh cách ly)
- Một phiên tmux (cho phép Agent chạy ở chế độ nền)
# 创建 worktree + 启动代理 git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install
tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high" Tại sao lại sử dụng tmux? Bởi vì có thể can thiệp giữa chừng.
Nếu AI đi sai hướng, không cần phải dừng lại và bắt đầu lại, chỉ cần gửi lệnh trong tmux:
# 代理方向错了 tmux send-keys -t codex-templates "Dừng lại. Hãy làm API trước, đừng quan tâm đến UI." Enter
代理需要更多上下文
tmux send-keys -t codex-templates "Định nghĩa loại ở src/types/template.ts, sử dụng cái đó." Enter Đồng thời, nhiệm vụ sẽ được ghi lại vào một tệp JSON.[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLDER5]] [[HTMLPLACEHOLDER6]] [[HTMLPLACEHOLDER7]] [[HTMLPLACEHOLDER8]] [[HTMLPLACEHOLDER9]] [[HTMLPLACEHOLDER10]] [[HTMLPLACEHOLDER11]] [[HTMLPLACEHOLDER12]] [[HTMLPLACEHOLDER13]] [[HTMLPLACEHOLDER14]] [[HTMLPLACEHOLDER15]] [[HTMLPLACEHOLDER16]] [[HTMLPLACEHOLDER17]] [[HTMLPLACEHOLDER18]] [[HTMLPLACEHOLDER19]] [[HTMLPLACEHOLDER20]] [[HTMLPLACEHOLDER21]] [[HTMLPLACEHOLDER22]] [[HTMLPLACEHOLDER23]] [[HTMLPLACEHOLDER24]] [[HTMLPLACEHOLDER25]] [[HTMLPLACEHOLDER26]] [[HTMLPLACEHOLDER27]]Quy trình hoàn chỉnh từ nhu cầu của khách hàng đến mã được triển khai có thể chỉ mất 1-2 giờ, trong khi thời gian thực tế của tác giả có thể chỉ là 10 phút.
Ba cơ chế giúp hệ thống thông minh hơn
Cơ chế 1: Phiên bản cải tiến của Ralph Loop — Không chỉ lặp lại, mà còn học hỏi
Bạn có thể đã nghe về Ralph Loop: Kéo ngữ cảnh từ bộ nhớ → Tạo đầu ra → Đánh giá kết quả → Lưu học hỏi.
Nhưng hầu hết các triển khai đều có một vấn đề: mỗi vòng lặp sử dụng cùng một prompt. Những gì học được cải thiện việc truy xuất trong tương lai, nhưng prompt thì vẫn tĩnh.
Hệ thống này thì khác.
Khi Agent thất bại, Zoe không khởi động lại với cùng một prompt. Cô ấy sẽ mang theo ngữ cảnh kinh doanh đầy đủ, phân tích nguyên nhân thất bại, sau đó viết lại prompt:
❌ Ví dụ xấu (prompt tĩnh): { "Thực hiện chức năng mẫu tùy chỉnh" }
✅ Ví dụ tốt (điều chỉnh động): { "Dừng lại. Khách hàng muốn X, không phải Y. Đây là lời nói của họ trong cuộc họp: Chúng tôi muốn giữ cấu hình hiện tại, thay vì tạo mới từ đầu. Tập trung vào việc tái sử dụng cấu hình, không tạo quy trình mới." }Zoe có thể thực hiện những điều chỉnh này vì cô ấy có ngữ cảnh mà Agent không có:
- Khách hàng đã nói gì trong cuộc họp
- Công ty này làm gì
- Tại sao yêu cầu tương tự trước đó lại thất bại
- Sáng: Quét Sentry → Phát hiện 4 lỗi mới → Khởi động 4 Agent để điều tra và sửa chữa
- Sau cuộc họp: Quét biên bản cuộc họp → Phát hiện 3 yêu cầu chức năng mà khách hàng đã đề cập → Khởi động 3 Codex
- Tối: Quét git log → Khởi động Claude Code để cập nhật changelog và tài liệu khách hàng
Mô hình thành công sẽ được ghi lại:
- "Cấu trúc prompt này rất hiệu quả cho chức năng hóa đơn"
- "Codex cần nhận được định nghĩa loại trước"
- "Luôn phải bao gồm đường dẫn tệp kiểm tra"
Thời gian càng lâu, prompt mà Zoe viết càng tốt, vì cô ấy nhớ điều gì có thể thành công.
Cơ chế 2: Chiến lược lựa chọn Agent — Tìm chuyên gia khác nhau cho các nhiệm vụ khác nhau
Không phải tất cả các Agent đều mạnh như nhau. Tác giả tổng kết chiến lược lựa chọn:
- Codex(gpt-5.3-codex) — Lực lượng chính - Logic backend, bug phức tạp, tái cấu trúc nhiều tệp, nhiệm vụ cần suy luận qua các kho mã
- Chậm nhưng triệt để
- Chiếm 90% nhiệm vụ
- Claude Code(claude-opus-4.5) — Người chơi tốc độ - Công việc frontend
- Ít vấn đề về quyền, phù hợp với thao tác git
- (Tác giả trước đây thường sử dụng hơn, nhưng đã chuyển sang Codex 5.3)
- Gemini — Nhà thiết kế - Có thẩm mỹ thiết kế
- Đối với UI đẹp, trước tiên để Gemini tạo ra tiêu chuẩn HTML/CSS, sau đó giao cho Claude Code thực hiện trong hệ thống thành phần
- Gemini thiết kế, Claude xây dựng
Cơ chế 3: Nút thắt ở đâu? RAM
Có một giới hạn bất ngờ ở đây: không phải chi phí token, không phải tốc độ API, mà là bộ nhớ.
Mỗi Agent cần:
- Worktree riêng
- nodemodules riêng
- Chạy xây dựng, kiểm tra loại, thử nghiệm
Mac Mini của tác giả (16GB RAM) tối đa chỉ chạy đồng thời 4-5 Agent, nhiều hơn thì bắt đầu hoán đổi, và phải cầu nguyện rằng chúng không cùng lúc xây dựng.Vì vậy, anh ấy đã mua một chiếc Mac Studio M4 Max (128GB RAM, $3500), sẽ đến vào cuối tháng 3. Anh ấy nói rằng sẽ chia sẻ xem có đáng giá không.
Bạn cũng có thể thiết lập: từ con số không đến hoạt động chỉ mất 10 phút
Bạn muốn thử nghiệm hệ thống này?
Cách đơn giản nhất:
Sao chép toàn bộ bài viết này cho OpenClaw, nói với nó: "Theo kiến trúc này, hãy triển khai một hệ thống cụm Agent cho kho mã của tôi."
Sau đó, nó sẽ:
- Đọc thiết kế kiến trúc
- Tạo kịch bản
- Thiết lập cấu trúc thư mục
- Cấu hình giám sát cron
Bạn cần chuẩn bị:
- Tài khoản OpenClaw
- Truy cập API của Codex và/hoặc Claude Code
- Một kho git
- (Tùy chọn) Obsidian để lưu trữ ngữ cảnh kinh doanh
2026: Công ty triệu đô của một người
Tác giả đã nói một câu ở cuối bài, tôi thấy rất có tính gợi mở:
"Chúng ta sẽ thấy rất nhiều công ty triệu đô của một người bắt đầu xuất hiện từ năm 2026. Đòn bẩy là rất lớn, thuộc về những người hiểu cách xây dựng hệ thống AI tự cải tiến đệ quy."
Đây là hình dạng của nó:
- Một AI điều phối viên như một phần mở rộng của bạn (giống như Zoe đối với tác giả)
- Phân công công việc cho các Agent chuyên biệt, xử lý các chức năng kinh doanh khác nhau
- Kỹ thuật, hỗ trợ khách hàng, vận hành, tiếp thị
- Mỗi Agent tập trung vào những gì nó giỏi
- Bạn giữ được sự tập trung và kiểm soát hoàn toàn
Hiện tại, có quá nhiều nội dung rác do AI tạo ra. Đủ loại quảng cáo, đủ loại demo hoa mỹ của "trung tâm điều khiển nhiệm vụ", nhưng không có thứ gì thực sự hữu ích.
Tác giả nói rằng anh ấy muốn làm điều ngược lại: ít quảng cáo hơn, nhiều ghi lại quá trình xây dựng thực tế hơn. Khách hàng thực, doanh thu thực, thực sự gửi phát hành vào môi trường sản xuất, cũng có những thất bại thực sự.
Bài viết này đến đây là kết thúc.
Tóm tắt các điểm chính:
- Kiến trúc hai lớp: lớp điều phối giữ ngữ cảnh kinh doanh, lớp thực thi tập trung vào mã
- Tự động hóa hoàn toàn: quy trình 8 bước từ yêu cầu đến PR, hầu hết các nhiệm vụ thành công ngay từ lần đầu
- Học tập động: không phải thực hiện lặp lại, mà là điều chỉnh chiến lược dựa trên nguyên nhân thất bại
- Chi phí có thể kiểm soát: bắt đầu từ $20/tháng, sử dụng nặng $190/tháng
Địa chỉ tham khảo:[[HTMLPLACEHOLDER_28]]

