OpenClaw + Claude Code/Codex：打造个人开发Agent Swarm

大家好，我是鲁工。

前段在X上刷到一条推文，瞬间就吸引了我。一个叫Elvis的独立开发者说，他现在已经不直接用Claude Code和Codex了，改用OpenClaw作为编排层，让一个叫Zoe的AI编排器去管理一整支Claude Code和Codex的Agent Swarm。

这条推文的数据也很炸裂，490万浏览，1.1万点赞，1800转发。

我们号写Vibe Coding四个多月，Claude Code一直是主力工具。我之前也写过一些多Agent协作、VSCode多Agent架构等相关文章。

但看到Elvis的这套玩法，我只能直呼内行了。一个人，靠一套编排系统，日均50次代码提交，最猛的一天提交了94次，还接了3个客户电话，编辑器一次都没打开。

这不就是一个人当一支开发团队用吗？

今天这篇文章就来拆解一下，他到底是怎么做到的。

OpenClaw大家都不陌生了

这只小龙虾春节前到现在，一直火爆。简单来说就是一个开源的AI Agent框架，GitHub上目前已经超过24万Star，并在前两天正式超越React，成为GitHub历史上star增长最快的开源项目。

创始人Peter Steinberger是奥地利开发者，之前创办过PSPDFKit（一个PDF框架的B2B公司），2021年拿了Insight Partners一亿欧元的投资。今年2月Peter宣布加入OpenAI，OpenClaw项目移交给开源基金会运营。

OpenClaw的定位不是聊天机器人，是一个跑在你本地设备上的AI Agent运行时。它有四个核心组件：Gateway（网关，连接50多个消息平台）、Agent（推理引擎）、Skills（5400多个插件）、Memory（记忆系统）。

但Elvis用OpenClaw的方式比较特别。他直接把它当成编排层，专门用来管理Claude Code和Codex这些编码Agent，没拿它当通用助手在使用。

这个思路确实很不一般。

为什么需要一个编排层呢？

Elvis在推文里提了一个很关键的观点：上下文窗口是零和博弈。

你往里面塞代码，就没空间放业务上下文了。你往里塞客户历史和会议记录，就没空间放代码库了。单个AI再强，它也没办法同时装下这两种完全不同类型的信息。

所以他把系统拆成了两层。

上层是OpenClaw的编排器Zoe，她掌握所有业务上下文，包括客户数据、会议记录、历史决策、哪些方案试过了、哪些失败了。这些信息全部存在Elvis的Obsidian笔记库里，Zoe可以直接读取。

下层是Claude Code和Codex这些编码Agent，它们只看代码，只管写代码。每个Agent启动的时候，Zoe会根据业务上下文给它写一份精准的prompt，告诉它该做什么、背景是什么、客户要的是什么。

简单来说了就是：编排器负责理解需求，编码Agent负责干活。各做各擅长的事。

这个架构和Stripe前段时间公开的内部系统Minions异曲同工。Stripe的Minions也是并行编码Agent加集中式编排层的设计，每周能合并1000多个完全由AI编写的PR。Elvis说他是无意中搭了个类似的架构，只不过跑在自己的Mac mini上。

真实案例工作流

Elvis在推文里用了一个真实案例来讲他的完整工作流，我把核心环节简单串一下。သူသည်ဖောက်သည်ဖုန်းခေါ်ဆိုမှုတစ်ခုကိုလက်ခံခဲ့ပြီး၊ ဖောက်သည်သည်အဖွဲ့အစည်းအတွင်းရှိရှိပြီးသားပြင်ဆင်မှုများကိုအသုံးပြုလိုသည်။ ဖုန်းခေါ်ဆိုမှုပြီးဆုံးပြီးနောက်၊ သူသည်Zoeနှင့်ဤလိုအပ်ချက်အကြောင်းစကားပြောခဲ့သည်။ အစည်းအဝေးမှတ်တမ်းများအားလုံးကိုObsidianသို့အလိုအလျောက်အဆက်အသွယ်ပြုလုပ်မည်ဖြစ်သောကြောင့်၊ Zoe သည်ဖောက်သည်ကဘာပြောခဲ့သည်ကိုသိပြီးဖြစ်သည်၊ Elvis သည်ထပ်မံရှင်းပြရန်မလိုအပ်ပါ။ သူတို့သည်လုပ်ဆောင်ချက်အကွာအဝေးကိုအတည်ပြုခဲ့ပြီး၊ နောက်ဆုံးအစီအစဉ်မှာတစ်ခုသောပုံစံစနစ်ကိုဖန်တီးရန်ဖြစ်သည်။

နောက်ထပ်Zoe သည်သုံးခုသောအရာများကိုအလိုအလျောက်လုပ်ဆောင်ခဲ့သည်။ ဖောက်သည်အတွက်ပြန်လည်ခွင့်ပြုမှုဝန်ဆောင်မှုကိုပြန်လည်ထည့်သွင်းပေးသည် (သူသည်အုပ်ချုပ်သူAPIခွင့်ပြုချက်ရှိသည်)၊ ထုတ်လုပ်မှုဒေတာဘေ့စ်မှဖောက်သည်ရှိပြီးသားပြင်ဆင်မှုကိုယူသည် (ဖတ်ရန်ခွင့်ပြုချက်၊ ကုဒ်ရေးဆွဲသူAgent သည်ဤခွင့်ပြုချက်မရှိပါ)၊ ထို့နောက်အပြည့်အစုံသောစီးပွားရေးအကြောင်းအရာပါဝင်သောအသေးစိတ်prompt ဖြင့်Codex Agent တစ်ခုကိုဖန်တီးသည်။

Agent တစ်ခုစီတွင်၎င်း၏ကိုယ်ပိုင်အလုပ်သမားသစ် (ခွဲခြားသောခွဲ) နှင့်tmuxအစည်းအဝေးရှိသည်။ စတင်ရန်အမိန့်သည်ဤအတိုင်းဖြစ်သည်-

# Create worktree + spawn agent git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high"Agent သည်စတင်ပြီးနောက် ၁၀ မိနစ်တိုင်းစစ်ဆေးမှုတစ်ခုရှိသည်။ သို့သော်၎င်းသည်Agent ကိုတိုက်ရိုက်မေးမည်မဟုတ်ပါ (အဲဒါက token များကိုအလွန်သုံးစွဲမည်)၊ သို့သော်သေချာသောShell script တစ်ခုကို run လုပ်ပြီးtmuxအစည်းအဝေးသည်မရှိတော့ဘူး၊ PR ဖန်တီးခဲ့ပါသလား၊ CI သည်အောင်မြင်ပါသလားစစ်ဆေးသည်။

CI မအောင်မြင်ပါက၊ Agent ကိုအလိုအလျောက်ပြန်လည်စတင်ပြီး ၃ ကြိမ်အထိပြန်လည်ကြိုးစားသည်။ လူသားအကူအညီလိုအပ်သောအခါတွင်သာသတင်းပို့သည်။

Agent သည်တာဝန်များကိုပြီးမြောက်ပြီးနောက် PR ကိုအလိုအလျောက်ဖန်တီးသည်။ သို့သော် PR ကိုဖန်တီးခြင်းသာမဟုတ်ပါ၊ Elvis သည်ပြီးမြောက်မှုစံချိန်တစ်ခုကိုသတ်မှတ်ထားသည်။ PR ဖန်တီးခြင်း၊ ခွဲကို main သို့အဆင်ပြေစွာချိတ်ဆက်ခြင်း (ပေါင်းစည်းမှုအဆင်မပြေ)၊ CI အားလုံးအောင်မြင်ခြင်း၊ AI မော်ဒယ်သုံးခု၏ကုဒ်သုံးသပ်မှုအားလုံးအောင်မြင်ခြင်း၊ UI ပြောင်းလဲမှုရှိပါက screenshot တစ်ခုကိုလည်းထည့်သွင်းရမည်။

AI မော်ဒယ်သုံးခုသည်ကုဒ်သုံးသပ်မှုလုပ်ဆောင်သည်

AI မော်ဒယ်သုံးခုသည်ကုဒ်သုံးသပ်မှုလုပ်ဆောင်သည်ဆိုသည်မှာတကယ်တည်ငြိမ်သည်။ သူသည်ဤသုံးခုမော်ဒယ်အပေါ်သုံးသပ်ချက်ကိုပြောပြသည်၊ အထူးစိတ်ဝင်စားဖွယ်ဖြစ်သည်။

Codex Reviewer၊ သူသည်အမြင့်ဆုံးအဆင့်သတ်မှတ်ပြီး၊ အစွန်းရောက်အခြေအနေများနှင့်အတွေးအခေါ်မှားယွင်းမှုများအပေါ်သုံးသပ်မှုသည်အထူးသဖြင့်ပြည့်စုံပြီး၊ အမှားအစစ်အမှားနှုန်းသည်အလွန်နိမ့်သည်။

Gemini Code Assist Reviewer၊ အခမဲ့၊ သူသည်အထူးအသုံးဝင်သည်၊ အခြားမော်ဒယ်များမှလွတ်လပ်သောလုံခြုံရေးအန္တရာယ်များနှင့်တိုးချဲ့နိုင်မှုပြproblemများကိုရှာဖွေနိုင်ပြီး၊ သေချာသောပြုပြင်မှုအစီအစဉ်များကိုပေးနိုင်သည်။

Claude Code Reviewer၊ သူ၏စကားလုံးမှာ"အခြားသောအရာများမရှိပါ"၊ သူက၎င်းသည်အလွန်သတိထားသည်ဟုဆိုပြီး၊ "ထည့်သွင်းရန်စဉ်းစားပါ..." စသည့်အကြံပြုချက်များဖြင့်ပြည့်နှက်နေသည်၊ အများစုသည်အလွန်ဒီဇိုင်းဖြစ်သည်။ အရေးကြီးသောပြproblemများအဖြစ်မှတ်သားမထားပါက၊ သူသည်တိုက်ရိုက်ကျော်ဖြတ်သည်။

ဤအပိုင်းကိုကြည့်သောအခါငါအံ့အားသင့်ခဲ့သည်။ Claude Code ၏အထူးအသုံးပြုသူအဖြစ်၊ ငါသည်ကုဒ်သုံးသပ်မှုအတွင်း၎င်း၏သတိထားမှုအလွန်ကြီးမားသောအခြေအနေများကိုတွေ့ခဲ့သည်၊ သို့သော်"အခြားသောအရာများမရှိပါ"ဆိုသည်မှာအလွန်ကျော်လွန်သည်။ သို့သော်ဤသည်သည်အခြားမော်ဒယ်များ၏အပြန်အလှန်သုံးသပ်မှုသည်တကယ်တန်ဖိုးရှိသည်ကိုဖျော်ဖြေရန်အထောက်အကူပြုသည်၊ မော်ဒယ်များ၏အမြင်များသည်တိကျစွာအပြန်အလှန်ဖြစ်သည်။

သုံးသပ်မှုသုံးခုလုံးအောင်မြင်ပြီးနောက်၊ Elvis သာTelegram သတင်းပို့မှုကိုရရှိမည်။ ဤအဆင့်တွင်၊ သူသည်အဓိပ္ပါယ်အဓိပ္ပါယ်ကိုကြည့်ပြီး UI ပြောင်းလဲမှုမှန်ကန်မှုကိုအတည်ပြုသည်၊ PR အများစုကိုကုဒ်ကိုကြည့်မထားဘဲတိုက်ရိုက်ပေါင်းစည်းသည်။ သူကသူ၏လူသားသုံးသပ်မှုသည် ၅ မှ ၁၀ မိနစ်သာလိုအပ်သည်ဟုဆိုသည်။

Zoe ၏လှုပ်ရှားမှု

Zoe သည်အကောင်အထည်ဖော်သူသာမကပါ။ အလုပ်စဉ်ကိုယ်တိုင်ထက်ပိုစိတ်ဝင်စားဖွယ်ကောင်းသည်မှာZoe ၏လှုပ်ရှားမှုဖြစ်သည်။

Elvis ကZoe သည်တာဝန်များကိုသတ်မှတ်ရန်စောင့်ဆိုင်းမထားဘူး၊ ၎င်းသည်လုပ်ငန်းရှာဖွေရန်လှုပ်ရှားသည်ဟုဆိုသည်။ မနက်ခင်း Sentry ၏အမှားမှတ်တမ်းကိုစစ်ဆေးပြီး၊ အမှားသစ် ၄ ခုကိုတွေ့ရှိပြီး၊ အလိုအလျောက် Agent ၄ ခုကိုဖန်တီးသည်။ အစည်းအဝေးပြီးနောက်အစည်းအဝေးမှတ်တမ်းကိုစစ်ဆေးပြီး၊ ဖောက်သည်ကဖော်ပြခဲ့သောလုပ်ဆောင်ချက် ၃ ခုကိုမှတ်သားပြီး၊ Codex Agent ၃ ခုကိုအလိုအလျောက်စတင်သည်။ ညနေ Git မှတ်တမ်းကိုစစ်ဆေးပြီး၊ Claude Code ကို changelog နှင့်ဖောက်သည်စာရွက်စာတမ်းကိုအဆင်ပြေစွာအဆင်ပြေစွာစတင်သည်။

Elvis သည်လမ်းလျှောက်ပြီးပြန်လာသောအခါ၊ Telegram တွင်သတင်းတစ်ပုဒ်ရှိသည်။ PR ၇ ခုကိုပြင်ဆင်ပြီး၊ လုပ်ဆောင်ချက်သစ် ၃ ခု၊ အမှားပြင်ဆင်မှု ၄ ခုရှိသည်။ ဤသည်သည်ငါအမြဲမျှော်လင့်ခဲ့သောOPC တစ်ဦးတည်းသောကုမ္ပဏီဖွံ့ဖြိုးရေးအဖွဲ့၏အကျိုးသက်ရောက်မှုမဟုတ်လား။而且当Agent失败的时候，Zoe的处理方式也比简单重试高级很多。它会结合业务上下文分析失败原因。Agent上下文爆了？它会缩小范围，让Agent只关注三个文件。Agent方向跑偏了？它也会纠正，告诉Agent客户要的是X不是Y，并附上会议中的原话。

随着时间推移，Zoe还会积累经验，记住哪些prompt结构对哪类任务效果好，下次写出更精准的prompt。

这个思路其实就是Ralph Loop的升级版。Ralph Loop的核心逻辑是拉取上下文、生成输出、评估结果、保存经验这样的循环，但大多数实现每次循环的prompt是固定的。Elvis的系统不一样，每次重试Zoe都会根据失败原因动态调整prompt，而且有完整的业务上下文加持。

费用与硬件

费用方面，Elvis公开的数据是Claude每月大约100美元，Codex每月大约90美元。他也说了，起步可以从20美元开始试试水。

这个费用跟雇一个开发者比当然是便宜到离谱。但如果考虑到你还需要自己做产品决策、客户沟通、代码审查，它更像是一个效率放大器，帮你省掉了编码和测试这些重复性最高的环节。

硬件方面，Elvis提到他目前最大的瓶颈是RAM。每个Agent需要独立的worktree，每个worktree有自己的nodemodules，每个Agent都要跑构建、类型检查和测试。5个Agent同时跑就意味着5个并行的TypeScript编译器、5个测试运行器、5套依赖项。

他的Mac mini 16GB内存最多同时跑4到5个Agent，再多就开始内存交换了。所以他买了一台128GB内存的Mac Studio M4 Max（3500美元），打算用它来扛更多的Agent并发。

总结与现实问题

老实说，Elvis这套系统给我的冲击还是挺大的。我之前一直把OpenClaw当做玩具在玩，在打造生产力方面，我都是依赖独立的Claude Code。偶尔用worktree做并行，但远没有到这种系统化编排的程度。看完他的推文之后，我觉得AI编程这件事的天花板又被拉高了一截。

我最近在按照他的思路，准备用OpenClaw打造完全自动化的一人开发团队。所以，近期我们号会出多篇OpenClaw的实践文章。

有几个现实问题还得给大家提个醒。

这套系统的前提是你得有一个清晰的产品、明确的客户需求、完善的CI/CD流水线。Elvis是在做一个真实的B2B SaaS产品，有客户、有收入、有生产环境。如果你还在写Demo或者学习阶段，这套架构的ROI可能不太划算。

另外，OpenClaw目前的安全问题也得注意。根据公开信息，已经有多个高危CVE被披露，还有341个恶意的社区插件被发现存在数据窃取行为。部署OpenClaw的时候，隔离和权限控制一定要做好。这也是我一直没有把OpenClaw部署在本地主力机上的原因。

还有一点，Elvis在推文里对Claude Code的代码审查评价偏低，但最近Claude Code刚推出了Agent Teams功能（官方内置的多Agent协作），Anthropic也在往编排这个方向发力。

不过抛开这些细节，Elvis这套编排层加执行层的架构思路确实值得关注。上下文窗口的零和博弈是真实存在的约束，用分层架构来解决这个问题，让不同的AI各司其职，这个方向我个人觉得是对的。
对这个话题感兴趣的朋友，可以直接去看Elvis的原推文，信息密度很高：[[HTMLPLACEHOLDER0]][[HTMLPLACEHOLDER_1]]

OpenClaw + Claude Code/Codex：打造个人开发Agent Swarm

OpenClaw + Claude Code/Codex：打造个人开发Agent Swarm

OpenClaw大家都不陌生了

为什么需要一个编排层呢？

真实案例工作流

AI မော်ဒယ်သုံးခုသည်ကုဒ်သုံးသပ်မှုလုပ်ဆောင်သည်

Zoe ၏လှုပ်ရှားမှု

费用与硬件

总结与现实问题

You Might Also Like

Claude Code Buddy ပြင်ဆင်မှု လမ်းညွှန်: မီးလောင် Legend အဆင့် အိမ်မွေးတိရစ္ဆာန်ရယူရန် ဘယ်လိုလုပ်မလဲ

Obsidian သည် Defuddle ကို ထုတ်လုပ်ပြီး Obsidian Web Clipper ကို အသစ်အဆန်းအဆင့်သို့ ရောက်ရှိစေသည်

2026，不再逼自己"自律"！做好这8件小事，健康自然来

那些努力减肥瘦不下来的妈妈们，绝对都栽在这里

AI Browser 24小時穩定運行指南