OpenClaw + Claude Code/Codex:Tạo ra Agent Swarm phát triển cá nhân
OpenClaw + Claude Code/Codex:Tạo ra Agent Swarm phát triển cá nhân
Xin chào mọi người, tôi là Lữ Công.
Gần đây tôi đã thấy một tweet trên X, ngay lập tức thu hút sự chú ý của tôi. Một nhà phát triển độc lập tên là Elvis nói rằng anh ấy không còn sử dụng trực tiếp Claude Code và Codex nữa, mà đã chuyển sang sử dụng OpenClaw như một lớp điều phối, để một AI điều phối viên tên là Zoe quản lý toàn bộ Agent Swarm của Claude Code và Codex.
Dữ liệu của tweet này cũng rất ấn tượng, 4.9 triệu lượt xem, 11 nghìn lượt thích, 1800 lượt retweet.
Chúng tôi đã viết Vibe Coding được hơn bốn tháng, Claude Code luôn là công cụ chính. Tôi cũng đã viết một số bài viết liên quan đến hợp tác nhiều Agent, kiến trúc nhiều Agent trong VSCode, v.v.
Nhưng khi thấy cách làm của Elvis, tôi chỉ có thể thốt lên rằng anh ấy thật sự là một người trong ngành. Một người, nhờ vào một hệ thống điều phối, trung bình mỗi ngày có 50 lần gửi mã, ngày cao nhất gửi 94 lần, còn nhận 3 cuộc gọi từ khách hàng, mà chưa mở trình soạn thảo một lần nào.
Đây chẳng phải là một người làm việc như một đội phát triển sao?
Hôm nay bài viết này sẽ phân tích xem anh ấy đã làm như thế nào.
OpenClaw không còn xa lạ với mọi người
Con tôm nhỏ này đã rất nổi tiếng từ trước Tết đến giờ. Nói đơn giản, đây là một khung AI Agent mã nguồn mở, hiện đã vượt qua 240.000 sao trên GitHub, và trong hai ngày qua đã chính thức vượt qua React, trở thành dự án mã nguồn mở có tốc độ tăng sao nhanh nhất trong lịch sử GitHub.
Người sáng lập Peter Steinberger là một nhà phát triển người Áo, trước đây đã thành lập PSPDFKit (một công ty B2B về khung PDF), vào năm 2021 đã nhận được 100 triệu euro đầu tư từ Insight Partners. Vào tháng 2 năm nay, Peter thông báo gia nhập OpenAI, dự án OpenClaw đã được chuyển giao cho quỹ mã nguồn mở để điều hành.
OpenClaw không phải là một chatbot, mà là một runtime AI Agent chạy trên thiết bị của bạn. Nó có bốn thành phần cốt lõi: Gateway (cổng, kết nối hơn 50 nền tảng nhắn tin), Agent (động cơ suy diễn), Skills (hơn 5400 plugin), Memory (hệ thống ghi nhớ).
Nhưng cách sử dụng OpenClaw của Elvis thì khá đặc biệt. Anh ấy trực tiếp sử dụng nó như một lớp điều phối, chuyên quản lý các Agent mã hóa như Claude Code và Codex, không sử dụng nó như một trợ lý đa năng.
Cách suy nghĩ này thực sự rất khác biệt.
Tại sao cần một lớp điều phối?
Elvis đã đưa ra một quan điểm rất quan trọng trong tweet: Cửa sổ ngữ cảnh là một trò chơi tổng bằng không.
Bạn nhét mã vào đó, thì không còn chỗ để chứa ngữ cảnh kinh doanh. Bạn nhét lịch sử khách hàng và biên bản cuộc họp vào, thì không còn chỗ để chứa kho mã. Dù AI đơn lẻ có mạnh đến đâu, nó cũng không thể chứa hai loại thông tin hoàn toàn khác nhau cùng một lúc.
Vì vậy, anh ấy đã tách hệ thống thành hai lớp.
Lớp trên là điều phối viên OpenClaw Zoe, cô ấy nắm giữ tất cả ngữ cảnh kinh doanh, bao gồm dữ liệu khách hàng, biên bản cuộc họp, quyết định lịch sử, những phương án đã thử, những phương án đã thất bại. Tất cả thông tin này đều có trong kho ghi chú Obsidian của Elvis, Zoe có thể đọc trực tiếp.
Lớp dưới là các Agent mã hóa như Claude Code và Codex, chúng chỉ xem mã, chỉ lo viết mã. Mỗi khi một Agent khởi động, Zoe sẽ viết cho nó một prompt chính xác dựa trên ngữ cảnh kinh doanh, cho nó biết phải làm gì, bối cảnh là gì, khách hàng cần gì.
Nói đơn giản là: điều phối viên chịu trách nhiệm hiểu nhu cầu, Agent mã hóa chịu trách nhiệm thực hiện công việc. Mỗi người làm việc mà họ giỏi nhất.
Kiến trúc này tương tự như hệ thống nội bộ Minions mà Stripe đã công bố gần đây. Minions của Stripe cũng là thiết kế Agent mã hóa song song kết hợp với lớp điều phối tập trung, mỗi tuần có thể hợp nhất hơn 1000 PR hoàn toàn do AI viết. Elvis nói rằng anh ấy đã vô tình xây dựng một kiến trúc tương tự, chỉ khác là chạy trên Mac mini của mình.
Quy trình làm việc thực tế
Elvis đã sử dụng một trường hợp thực tế trong tweet để nói về quy trình làm việc hoàn chỉnh của anh ấy, tôi sẽ tóm tắt các bước chính.他接了一个客户电话,客户想在团队内部复用已有的配置。通话结束后,他跟Zoe聊了一下这个需求。因为所有会议记录都会自动同步到Obsidian,Zoe已经知道客户说了什么,不需要Elvis额外解释。他们一起确定了功能范围,最终方案是做一个模板系统。\n\n然后Zoe自动做了三件事:给客户充值解锁服务(她有管理员API权限),从生产数据库拉取客户现有配置(只读权限,编码Agent永远不会有这个权限),然后生成一个Codex Agent,带着包含完整业务上下文的详细prompt。\n\n每个Agent都有自己独立的worktree(隔离分支)和tmux会话。启动命令大概是这样的:\n\n# Create worktree + spawn agent\ngit worktree add ../feat-custom-templates -b feat/custom-templates origin/main\ncd ../feat-custom-templates && pnpm install\ntmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high\nAgent跑起来之后,有一个定时任务每10分钟巡检一次。但它不会直接去问Agent(那样太烧token了),而是跑一个确定性的Shell脚本,检查tmux会话是否还活着、有没有创建PR、CI是否通过。\n\n如果CI失败了,自动重启Agent,最多重试3次。只有需要人工干预的时候才发通知。\n\nAgent完成任务后会自动创建PR。但光创建PR还不算完,Elvis定义了一套完成标准:PR创建、分支同步到main(无合并冲突)、CI全部通过、三个AI模型的代码审查全部通过、如果有UI改动还必须附截图。\n\n## 三个AI模型做代码审查\n\n三个AI模型做代码审查看起来就很稳。聊一下他对这三个模型的评价,挺有意思的。\n\nCodex Reviewer,他评价最高,说它在边界情况和逻辑错误方面的审查非常彻底,误报率很低。\n\nGemini Code Assist Reviewer,免费的,他说非常实用,能发现其他模型遗漏的安全隐患和可扩展性问题,还能给出具体修复方案。\n\nClaude Code Reviewer,他的原话是"基本没用",说它过度谨慎,满屏都是"考虑添加..."之类的建议,大部分属于过度设计。除非标记为关键问题,否则他直接跳过。\n\n我看到这段的时候有点惊讶。作为Claude Code的重度用户,我确实也遇到过它在代码审查时过于保守的情况,但基本没用这个评价还是有点过了。不过这也从侧面说明,多模型交叉审查确实有价值,不同模型的偏见刚好互补。\n\n三个审查全部通过后,Elvis才会收到Telegram通知。到这一步,他看的主要是截图,确认UI改动是否正确,很多PR他不看代码就直接合并了。他说自己的人工审查只需要5到10分钟。\n\n## Zoe的主动性\n\nZoe不只是执行者。比工作流本身更有意思的是Zoe的主动性。\n\nElvis说Zoe不会坐等它分配任务,它会主动找活干。早上扫描Sentry的错误日志,发现4个新错误,自动生成4个Agent去修。开完会扫描会议记录,标记出客户提到的3个功能需求,然后自动启动3个Codex Agent。晚上扫描Git日志,启动Claude Code更新changelog和客户文档。\n\nElvis出门遛个弯回来,Telegram上就躺着一条消息:7个PR准备好了,3个新功能,4个bug修复。这不就是我一直期望打造的OPC一人公司开发团队效果吗。Hơn nữa, khi Agent gặp sự cố, cách xử lý của Zoe cũng cao cấp hơn nhiều so với việc thử lại đơn giản. Nó sẽ phân tích nguyên nhân thất bại kết hợp với ngữ cảnh kinh doanh. Ngữ cảnh của Agent bị nổ? Nó sẽ thu hẹp phạm vi, chỉ để Agent tập trung vào ba tệp. Hướng đi của Agent bị lệch? Nó cũng sẽ điều chỉnh, nói với Agent rằng khách hàng cần X chứ không phải Y, và kèm theo lời nói gốc trong cuộc họp.
Theo thời gian, Zoe cũng sẽ tích lũy kinh nghiệm, ghi nhớ cấu trúc prompt nào hiệu quả cho loại nhiệm vụ nào, để lần sau viết ra prompt chính xác hơn.
Ý tưởng này thực ra là phiên bản nâng cấp của Ralph Loop. Logic cốt lõi của Ralph Loop là kéo ngữ cảnh, tạo ra đầu ra, đánh giá kết quả, lưu giữ kinh nghiệm trong một vòng lặp như vậy, nhưng hầu hết các triển khai đều có prompt cố định cho mỗi vòng lặp. Hệ thống của Elvis thì khác, mỗi lần thử lại Zoe sẽ điều chỉnh prompt một cách linh hoạt dựa trên nguyên nhân thất bại, và có ngữ cảnh kinh doanh đầy đủ hỗ trợ.
Chi phí và phần cứng
Về chi phí, dữ liệu công khai của Elvis cho biết Claude tốn khoảng 100 đô la mỗi tháng, Codex tốn khoảng 90 đô la mỗi tháng. Anh cũng nói rằng, có thể bắt đầu thử nghiệm từ 20 đô la.
Chi phí này so với việc thuê một nhà phát triển thì rõ ràng là rẻ đến mức không tưởng. Nhưng nếu xem xét rằng bạn còn cần tự mình đưa ra quyết định sản phẩm, giao tiếp với khách hàng, kiểm tra mã, thì nó giống như một bộ khuếch đại hiệu suất, giúp bạn tiết kiệm những khâu lặp đi lặp lại như lập trình và kiểm thử.
Về phần cứng, Elvis đề cập rằng nút thắt lớn nhất hiện tại của anh là RAM. Mỗi Agent cần một worktree độc lập, mỗi worktree có node_modules riêng, mỗi Agent đều phải chạy xây dựng, kiểm tra kiểu và kiểm thử. 5 Agent chạy đồng thời có nghĩa là 5 trình biên dịch TypeScript song song, 5 trình chạy thử nghiệm, 5 bộ phụ thuộc.
Mac mini 16GB của anh có thể chạy tối đa 4 đến 5 Agent cùng lúc, nhiều hơn thì bắt đầu hoán đổi bộ nhớ. Vì vậy, anh đã mua một chiếc Mac Studio M4 Max với 128GB RAM (3500 đô la), dự định sử dụng nó để xử lý nhiều Agent đồng thời hơn.
Tóm tắt và vấn đề thực tế
Nói thật, hệ thống của Elvis đã gây ấn tượng mạnh mẽ với tôi. Trước đây, tôi luôn coi OpenClaw như một món đồ chơi, trong việc tạo ra năng suất, tôi đều dựa vào Claude Code độc lập. Thỉnh thoảng sử dụng worktree để làm song song, nhưng chưa bao giờ đạt đến mức độ hệ thống hóa như vậy. Sau khi xem xong tweet của anh, tôi cảm thấy trần của lập trình AI lại được nâng cao thêm một bậc.
Gần đây, tôi đang theo hướng của anh, chuẩn bị sử dụng OpenClaw để xây dựng một đội ngũ phát triển hoàn toàn tự động chỉ với một người. Vì vậy, trong thời gian tới, chúng tôi sẽ xuất bản nhiều bài viết thực hành về OpenClaw.
Có một số vấn đề thực tế cần nhắc nhở mọi người.
Tiền đề của hệ thống này là bạn phải có một sản phẩm rõ ràng, nhu cầu khách hàng xác định, và một quy trình CI/CD hoàn chỉnh. Elvis đang làm một sản phẩm B2B SaaS thực sự, có khách hàng, có doanh thu, có môi trường sản xuất. Nếu bạn vẫn đang viết Demo hoặc trong giai đoạn học tập, ROI của kiến trúc này có thể không hợp lý.
Ngoài ra, vấn đề an ninh hiện tại của OpenClaw cũng cần chú ý. Theo thông tin công khai, đã có nhiều CVE nguy hiểm được công bố, và có 341 plugin cộng đồng độc hại đã được phát hiện có hành vi đánh cắp dữ liệu. Khi triển khai OpenClaw, việc cách ly và kiểm soát quyền truy cập phải được thực hiện tốt. Đây cũng là lý do tôi chưa triển khai OpenClaw trên máy chủ chính của mình.
Một điểm nữa, Elvis trong tweet của mình đã đánh giá thấp việc kiểm tra mã của Claude Code, nhưng gần đây Claude Code vừa mới ra mắt tính năng Agent Teams (hợp tác đa Agent tích hợp sẵn), Anthropic cũng đang hướng tới việc điều phối theo hướng này.
Tuy nhiên, bỏ qua những chi tiết này, kiến trúc lớp điều phối và lớp thực thi của Elvis thực sự đáng chú ý. Cuộc chơi zero-sum của cửa sổ ngữ cảnh là một ràng buộc thực sự tồn tại, việc sử dụng kiến trúc phân lớp để giải quyết vấn đề này, để các AI khác nhau thực hiện nhiệm vụ của mình, theo tôi là đúng hướng....

