OpenClaw + Claude Code/Codex:打造个人开发Agent Swarm
OpenClaw + Claude Code/Codex:打造个人开发Agent Swarm
大家好,我是鲁工。
前段在X上刷到一条推文,瞬间就吸引了我。一个叫Elvis的独立开发者说,他现在已经不直接用Claude Code和Codex了,改用OpenClaw作为编排层,让一个叫Zoe的AI编排器去管理一整支Claude Code和Codex的Agent Swarm。
这条推文的数据也很炸裂,490万浏览,1.1万点赞,1800转发。
我们号写Vibe Coding四个多月,Claude Code一直是主力工具。我之前也写过一些多Agent协作、VSCode多Agent架构等相关文章。
但看到Elvis的这套玩法,我只能直呼内行了。一个人,靠一套编排系统,日均50次代码提交,最猛的一天提交了94次,还接了3个客户电话,编辑器一次都没打开。
这不就是一个人当一支开发团队用吗?
今天这篇文章就来拆解一下,他到底是怎么做到的。
OpenClaw大家都不陌生了
这只小龙虾春节前到现在,一直火爆。简单来说就是一个开源的AI Agent框架,GitHub上目前已经超过24万Star,并在前两天正式超越React,成为GitHub历史上star增长最快的开源项目。
创始人Peter Steinberger是奥地利开发者,之前创办过PSPDFKit(一个PDF框架的B2B公司),2021年拿了Insight Partners一亿欧元的投资。今年2月Peter宣布加入OpenAI,OpenClaw项目移交给开源基金会运营。
OpenClaw的定位不是聊天机器人,是一个跑在你本地设备上的AI Agent运行时。它有四个核心组件:Gateway(网关,连接50多个消息平台)、Agent(推理引擎)、Skills(5400多个插件)、Memory(记忆系统)。
但Elvis用OpenClaw的方式比较特别。他直接把它当成编排层,专门用来管理Claude Code和Codex这些编码Agent,没拿它当通用助手在使用。
这个思路确实很不一般。
为什么需要一个编排层呢?
Elvis在推文里提了一个很关键的观点:上下文窗口是零和博弈。
你往里面塞代码,就没空间放业务上下文了。你往里塞客户历史和会议记录,就没空间放代码库了。单个AI再强,它也没办法同时装下这两种完全不同类型的信息。
所以他把系统拆成了两层。
上层是OpenClaw的编排器Zoe,她掌握所有业务上下文,包括客户数据、会议记录、历史决策、哪些方案试过了、哪些失败了。这些信息全部存在Elvis的Obsidian笔记库里,Zoe可以直接读取。
下层是Claude Code和Codex这些编码Agent,它们只看代码,只管写代码。每个Agent启动的时候,Zoe会根据业务上下文给它写一份精准的prompt,告诉它该做什么、背景是什么、客户要的是什么。
简单来说了就是:编排器负责理解需求,编码Agent负责干活。各做各擅长的事。
这个架构和Stripe前段时间公开的内部系统Minions异曲同工。Stripe的Minions也是并行编码Agent加集中式编排层的设计,每周能合并1000多个完全由AI编写的PR。Elvis说他是无意中搭了个类似的架构,只不过跑在自己的Mac mini上。
真实案例工作流
Elvis在推文里用了一个真实案例来讲他的完整工作流,我把核心环节简单串一下。သူသည်ဖောက်သည်ဖုန်းခေါ်ဆိုမှုတစ်ခုကိုလက်ခံခဲ့ပြီး၊ ဖောက်သည်သည်အဖွဲ့အစည်းအတွင်းရှိရှိပြီးသားပြင်ဆင်မှုများကိုအသုံးပြုလိုသည်။ ဖုန်းခေါ်ဆိုမှုပြီးဆုံးပြီးနောက်၊ သူသည်Zoeနှင့်ဤလိုအပ်ချက်အကြောင်းစကားပြောခဲ့သည်။ အစည်းအဝေးမှတ်တမ်းများအားလုံးကိုObsidianသို့အလိုအလျောက်အဆက်အသွယ်ပြုလုပ်မည်ဖြစ်သောကြောင့်၊ Zoe သည်ဖောက်သည်ကဘာပြောခဲ့သည်ကိုသိပြီးဖြစ်သည်၊ Elvis သည်ထပ်မံရှင်းပြရန်မလိုအပ်ပါ။ သူတို့သည်လုပ်ဆောင်ချက်အကွာအဝေးကိုအတည်ပြုခဲ့ပြီး၊ နောက်ဆုံးအစီအစဉ်မှာတစ်ခုသောပုံစံစနစ်ကိုဖန်တီးရန်ဖြစ်သည်။
နောက်ထပ်Zoe သည်သုံးခုသောအရာများကိုအလိုအလျောက်လုပ်ဆောင်ခဲ့သည်။ ဖောက်သည်အတွက်ပြန်လည်ခွင့်ပြုမှုဝန်ဆောင်မှုကိုပြန်လည်ထည့်သွင်းပေးသည် (သူသည်အုပ်ချုပ်သူAPIခွင့်ပြုချက်ရှိသည်)၊ ထုတ်လုပ်မှုဒေတာဘေ့စ်မှဖောက်သည်ရှိပြီးသားပြင်ဆင်မှုကိုယူသည် (ဖတ်ရန်ခွင့်ပြုချက်၊ ကုဒ်ရေးဆွဲသူAgent သည်ဤခွင့်ပြုချက်မရှိပါ)၊ ထို့နောက်အပြည့်အစုံသောစီးပွားရေးအကြောင်းအရာပါဝင်သောအသေးစိတ်prompt ဖြင့်Codex Agent တစ်ခုကိုဖန်တီးသည်။
Agent တစ်ခုစီတွင်၎င်း၏ကိုယ်ပိုင်အလုပ်သမားသစ် (ခွဲခြားသောခွဲ) နှင့်tmuxအစည်းအဝေးရှိသည်။ စတင်ရန်အမိန့်သည်ဤအတိုင်းဖြစ်သည်-
# Create worktree + spawn agent git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high"Agent သည်စတင်ပြီးနောက် ၁၀ မိနစ်တိုင်းစစ်ဆေးမှုတစ်ခုရှိသည်။ သို့သော်၎င်းသည်Agent ကိုတိုက်ရိုက်မေးမည်မဟုတ်ပါ (အဲဒါက token များကိုအလွန်သုံးစွဲမည်)၊ သို့သော်သေချာသောShell script တစ်ခုကို run လုပ်ပြီးtmuxအစည်းအဝေးသည်မရှိတော့ဘူး၊ PR ဖန်တီးခဲ့ပါသလား၊ CI သည်အောင်မြင်ပါသလားစစ်ဆေးသည်။
CI မအောင်မြင်ပါက၊ Agent ကိုအလိုအလျောက်ပြန်လည်စတင်ပြီး ၃ ကြိမ်အထိပြန်လည်ကြိုးစားသည်။ လူသားအကူအညီလိုအပ်သောအခါတွင်သာသတင်းပို့သည်။
Agent သည်တာဝန်များကိုပြီးမြောက်ပြီးနောက် PR ကိုအလိုအလျောက်ဖန်တီးသည်။ သို့သော် PR ကိုဖန်တီးခြင်းသာမဟုတ်ပါ၊ Elvis သည်ပြီးမြောက်မှုစံချိန်တစ်ခုကိုသတ်မှတ်ထားသည်။ PR ဖန်တီးခြင်း၊ ခွဲကို main သို့အဆင်ပြေစွာချိတ်ဆက်ခြင်း (ပေါင်းစည်းမှုအဆင်မပြေ)၊ CI အားလုံးအောင်မြင်ခြင်း၊ AI မော်ဒယ်သုံးခု၏ကုဒ်သုံးသပ်မှုအားလုံးအောင်မြင်ခြင်း၊ UI ပြောင်းလဲမှုရှိပါက screenshot တစ်ခုကိုလည်းထည့်သွင်းရမည်။
AI မော်ဒယ်သုံးခုသည်ကုဒ်သုံးသပ်မှုလုပ်ဆောင်သည်
AI မော်ဒယ်သုံးခုသည်ကုဒ်သုံးသပ်မှုလုပ်ဆောင်သည်ဆိုသည်မှာတကယ်တည်ငြိမ်သည်။ သူသည်ဤသုံးခုမော်ဒယ်အပေါ်သုံးသပ်ချက်ကိုပြောပြသည်၊ အထူးစိတ်ဝင်စားဖွယ်ဖြစ်သည်။
Codex Reviewer၊ သူသည်အမြင့်ဆုံးအဆင့်သတ်မှတ်ပြီး၊ အစွန်းရောက်အခြေအနေများနှင့်အတွေးအခေါ်မှားယွင်းမှုများအပေါ်သုံးသပ်မှုသည်အထူးသဖြင့်ပြည့်စုံပြီး၊ အမှားအစစ်အမှားနှုန်းသည်အလွန်နိမ့်သည်။
Gemini Code Assist Reviewer၊ အခမဲ့၊ သူသည်အထူးအသုံးဝင်သည်၊ အခြားမော်ဒယ်များမှလွတ်လပ်သောလုံခြုံရေးအန္တရာယ်များနှင့်တိုးချဲ့နိုင်မှုပြproblemများကိုရှာဖွေနိုင်ပြီး၊ သေချာသောပြုပြင်မှုအစီအစဉ်များကိုပေးနိုင်သည်။
Claude Code Reviewer၊ သူ၏စကားလုံးမှာ"အခြားသောအရာများမရှိပါ"၊ သူက၎င်းသည်အလွန်သတိထားသည်ဟုဆိုပြီး၊ "ထည့်သွင်းရန်စဉ်းစားပါ..." စသည့်အကြံပြုချက်များဖြင့်ပြည့်နှက်နေသည်၊ အများစုသည်အလွန်ဒီဇိုင်းဖြစ်သည်။ အရေးကြီးသောပြproblemများအဖြစ်မှတ်သားမထားပါက၊ သူသည်တိုက်ရိုက်ကျော်ဖြတ်သည်။
ဤအပိုင်းကိုကြည့်သောအခါငါအံ့အားသင့်ခဲ့သည်။ Claude Code ၏အထူးအသုံးပြုသူအဖြစ်၊ ငါသည်ကုဒ်သုံးသပ်မှုအတွင်း၎င်း၏သတိထားမှုအလွန်ကြီးမားသောအခြေအနေများကိုတွေ့ခဲ့သည်၊ သို့သော်"အခြားသောအရာများမရှိပါ"ဆိုသည်မှာအလွန်ကျော်လွန်သည်။ သို့သော်ဤသည်သည်အခြားမော်ဒယ်များ၏အပြန်အလှန်သုံးသပ်မှုသည်တကယ်တန်ဖိုးရှိသည်ကိုဖျော်ဖြေရန်အထောက်အကူပြုသည်၊ မော်ဒယ်များ၏အမြင်များသည်တိကျစွာအပြန်အလှန်ဖြစ်သည်။
သုံးသပ်မှုသုံးခုလုံးအောင်မြင်ပြီးနောက်၊ Elvis သာTelegram သတင်းပို့မှုကိုရရှိမည်။ ဤအဆင့်တွင်၊ သူသည်အဓိပ္ပါယ်အဓိပ္ပါယ်ကိုကြည့်ပြီး UI ပြောင်းလဲမှုမှန်ကန်မှုကိုအတည်ပြုသည်၊ PR အများစုကိုကုဒ်ကိုကြည့်မထားဘဲတိုက်ရိုက်ပေါင်းစည်းသည်။ သူကသူ၏လူသားသုံးသပ်မှုသည် ၅ မှ ၁၀ မိနစ်သာလိုအပ်သည်ဟုဆိုသည်။
Zoe ၏လှုပ်ရှားမှု
Zoe သည်အကောင်အထည်ဖော်သူသာမကပါ။ အလုပ်စဉ်ကိုယ်တိုင်ထက်ပိုစိတ်ဝင်စားဖွယ်ကောင်းသည်မှာZoe ၏လှုပ်ရှားမှုဖြစ်သည်။
Elvis ကZoe သည်တာဝန်များကိုသတ်မှတ်ရန်စောင့်ဆိုင်းမထားဘူး၊ ၎င်းသည်လုပ်ငန်းရှာဖွေရန်လှုပ်ရှားသည်ဟုဆိုသည်။ မနက်ခင်း Sentry ၏အမှားမှတ်တမ်းကိုစစ်ဆေးပြီး၊ အမှားသစ် ၄ ခုကိုတွေ့ရှိပြီး၊ အလိုအလျောက် Agent ၄ ခုကိုဖန်တီးသည်။ အစည်းအဝေးပြီးနောက်အစည်းအဝေးမှတ်တမ်းကိုစစ်ဆေးပြီး၊ ဖောက်သည်ကဖော်ပြခဲ့သောလုပ်ဆောင်ချက် ၃ ခုကိုမှတ်သားပြီး၊ Codex Agent ၃ ခုကိုအလိုအလျောက်စတင်သည်။ ညနေ Git မှတ်တမ်းကိုစစ်ဆေးပြီး၊ Claude Code ကို changelog နှင့်ဖောက်သည်စာရွက်စာတမ်းကိုအဆင်ပြေစွာအဆင်ပြေစွာစတင်သည်။
Elvis သည်လမ်းလျှောက်ပြီးပြန်လာသောအခါ၊ Telegram တွင်သတင်းတစ်ပုဒ်ရှိသည်။ PR ၇ ခုကိုပြင်ဆင်ပြီး၊ လုပ်ဆောင်ချက်သစ် ၃ ခု၊ အမှားပြင်ဆင်မှု ၄ ခုရှိသည်။ ဤသည်သည်ငါအမြဲမျှော်လင့်ခဲ့သောOPC တစ်ဦးတည်းသောကုမ္ပဏီဖွံ့ဖြိုးရေးအဖွဲ့၏အကျိုးသက်ရောက်မှုမဟုတ်လား။而且当Agent失败的时候,Zoe的处理方式也比简单重试高级很多。它会结合业务上下文分析失败原因。Agent上下文爆了?它会缩小范围,让Agent只关注三个文件。Agent方向跑偏了?它也会纠正,告诉Agent客户要的是X不是Y,并附上会议中的原话。
随着时间推移,Zoe还会积累经验,记住哪些prompt结构对哪类任务效果好,下次写出更精准的prompt。
这个思路其实就是Ralph Loop的升级版。Ralph Loop的核心逻辑是拉取上下文、生成输出、评估结果、保存经验这样的循环,但大多数实现每次循环的prompt是固定的。Elvis的系统不一样,每次重试Zoe都会根据失败原因动态调整prompt,而且有完整的业务上下文加持。
费用与硬件
费用方面,Elvis公开的数据是Claude每月大约100美元,Codex每月大约90美元。他也说了,起步可以从20美元开始试试水。
这个费用跟雇一个开发者比当然是便宜到离谱。但如果考虑到你还需要自己做产品决策、客户沟通、代码审查,它更像是一个效率放大器,帮你省掉了编码和测试这些重复性最高的环节。
硬件方面,Elvis提到他目前最大的瓶颈是RAM。每个Agent需要独立的worktree,每个worktree有自己的nodemodules,每个Agent都要跑构建、类型检查和测试。5个Agent同时跑就意味着5个并行的TypeScript编译器、5个测试运行器、5套依赖项。
他的Mac mini 16GB内存最多同时跑4到5个Agent,再多就开始内存交换了。所以他买了一台128GB内存的Mac Studio M4 Max(3500美元),打算用它来扛更多的Agent并发。
总结与现实问题
老实说,Elvis这套系统给我的冲击还是挺大的。我之前一直把OpenClaw当做玩具在玩,在打造生产力方面,我都是依赖独立的Claude Code。偶尔用worktree做并行,但远没有到这种系统化编排的程度。看完他的推文之后,我觉得AI编程这件事的天花板又被拉高了一截。
我最近在按照他的思路,准备用OpenClaw打造完全自动化的一人开发团队。所以,近期我们号会出多篇OpenClaw的实践文章。
有几个现实问题还得给大家提个醒。
这套系统的前提是你得有一个清晰的产品、明确的客户需求、完善的CI/CD流水线。Elvis是在做一个真实的B2B SaaS产品,有客户、有收入、有生产环境。如果你还在写Demo或者学习阶段,这套架构的ROI可能不太划算。
另外,OpenClaw目前的安全问题也得注意。根据公开信息,已经有多个高危CVE被披露,还有341个恶意的社区插件被发现存在数据窃取行为。部署OpenClaw的时候,隔离和权限控制一定要做好。这也是我一直没有把OpenClaw部署在本地主力机上的原因。
还有一点,Elvis在推文里对Claude Code的代码审查评价偏低,但最近Claude Code刚推出了Agent Teams功能(官方内置的多Agent协作),Anthropic也在往编排这个方向发力。
不过抛开这些细节,Elvis这套编排层加执行层的架构思路确实值得关注。上下文窗口的零和博弈是真实存在的约束,用分层架构来解决这个问题,让不同的AI各司其职,这个方向我个人觉得是对的。
对这个话题感兴趣的朋友,可以直接去看Elvis的原推文,信息密度很高:[[HTMLPLACEHOLDER0]][[HTMLPLACEHOLDER_1]]
