OpenClaw + Claude Code/Codex:વ્યક્તિગત વિકાસ એજન્ટ સ્વાર્મ બનાવવું
OpenClaw + Claude Code/Codex:વ્યક્તિગત વિકાસ એજન્ટ સ્વાર્મ બનાવવું
大家好,我是鲁工。
前段在X上刷到一条推文,瞬间就吸引了我。一个叫Elvis的独立开发者说,他现在已经不直接用Claude Code和Codex了,改用OpenClaw作为编排层,让一个叫Zoe的AI编排器去管理一整支Claude Code和Codex的Agent Swarm。
这条推文的数据也很炸裂,490万浏览,1.1万点赞,1800转发。
我们号写Vibe Coding四个多月,Claude Code一直是主力工具。我之前也写过一些多Agent协作、VSCode多Agent架构等相关文章。
但看到Elvis的这套玩法,我只能直呼内行了。一个人,靠一套编排系统,日均50次代码提交,最猛的一天提交了94次,还接了3个客户电话,编辑器一次都没打开。
这不就是一个人当一支开发团队用吗?
今天这篇文章就来拆解一下,他到底是怎么做到的。
OpenClaw大家都不陌生了
这只小龙虾春节前到现在,一直火爆。简单来说就是一个开源的AI Agent框架,GitHub上目前已经超过24万Star,并在前两天正式超越React,成为GitHub历史上star增长最快的开源项目。
创始人Peter Steinberger是奥地利开发者,之前创办过PSPDFKit(一个PDF框架的B2B公司),2021年拿了Insight Partners一亿欧元的投资。今年2月Peter宣布加入OpenAI,OpenClaw项目移交给开源基金会运营。
OpenClaw的定位不是聊天机器人,是一个跑在你本地设备上的AI Agent运行时。它有四个核心组件:Gateway(ગેટવે,连接50多个消息平台)、Agent(推理引擎)、Skills(5400多个插件)、Memory(યાદ રાખવાની સિસ્ટમ)。
但Elvis用OpenClaw的方式比较特别。他直接把它当成编排层,专门用来管理Claude Code和Codex这些编码Agent,没拿它当通用助手在使用。
这个思路确实很不一般。
为什么需要一个编排层呢?
Elvis在推文里提了一个很关键的观点:上下文窗口是零和博弈。
你往里面塞代码,就没空间放业务上下文了。你往里塞客户历史和会议记录,就没空间放代码库了。单个AI再强,它也没办法同时装下这两种完全不同类型的信息。
所以他把系统拆成了两层。
上层是OpenClaw的编排器Zoe,她掌握所有业务上下文,包括客户数据、会议记录、历史决策、哪些方案试过了、哪些失败了。这些信息全部存在Elvis的Obsidian笔记库里,Zoe可以直接读取。
下层是Claude Code和Codex这些编码Agent,它们只看代码,只管写代码。每个Agent启动的时候,Zoe会根据业务上下文给它写一份精准的prompt,告诉它该做什么、背景是什么、客户要的是什么。
简单来说了就是:编排器负责理解需求,编码Agent负责干活。各做各擅长的事。
这个架构和Stripe前段时间公开的内部系统Minions异曲同工。Stripe的Minions也是并行编码Agent加集中式编排层的设计,每周能合并1000多个完全由AI编写的PR。Elvis说他是无意中搭了个类似的架构,只不过跑在自己的Mac mini上。
真实案例工作流
Elvis在推文里用了一个真实案例来讲他的完整工作流,我把核心环节简单串一下。તે એક ગ્રાહકના ફોનનો જવાબ આપ્યો, ગ્રાહક ટીમની અંદર પહેલેથી જ ઉપલબ્ધ રૂપરેખાઓનો પુનઃઉપયોગ કરવા માંગતો હતો. ફોનકૉલ પૂરો થયા પછી, તેણે ઝોઇ સાથે આ જરૂરિયાત વિશે વાત કરી. કારણ કે તમામ બેઠકના નોંધો આપોઆપ ઓબ્સિડિયનમાં સમન્વયિત થાય છે, ઝોઇને પહેલેથી જ જાણ હતી કે ગ્રાહકે શું કહ્યું, એલ્વિસને વધારાના સ્પષ્ટીકરણની જરૂર નહોતી. તેમણે સાથે મળીને કાર્યક્ષેત્ર નિર્ધારિત કર્યું, અંતિમ યોજના એક ટેમ્પલેટ સિસ્ટમ બનાવવાની હતી.
પછી ઝોઇએ આપોઆપ ત્રણ કામ કર્યા: ગ્રાહકને અનલોક સેવા માટે રિચાર્જ આપવું (તે પાસે એડમિનિસ્ટ્રેટર API અધિકાર છે), ઉત્પાદન ડેટાબેસમાંથી ગ્રાહકની હાલની રૂપરેખાઓ ખેંચવી (ફક્ત વાંચન અધિકાર, કોડિંગ એજન્ટ પાસે ક્યારેય આ અધિકાર નહીં હોય), અને પછી એક કોડેક્સ એજન્ટ બનાવવો, જેમાં સંપૂર્ણ વ્યવસાય સંદર્ભ સાથેની વિગતવાર પ્રોમ્પ્ટ હોય.
દરેક એજન્ટ પાસે પોતાનો સ્વતંત્ર વર્કટ્રી (અલગ શાખા) અને tmux સત્ર હોય છે. શરૂ કરવાની આદેશ લગભગ આ રીતે છે:
# વર્કટ્રી બનાવો + એજન્ટ શરૂ કરો git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high" એજન્ટ શરૂ થયા પછી, દર 10 મિનિટે એક સમયસર કાર્ય થાય છે. પરંતુ તે સીધા એજન્ટને પૂછતું નથી (એવું કરવું ટોકનને વધુ બર્ન કરે છે), પરંતુ એક નિશ્ચિત શેલ સ્ક્રિપ્ટ ચલાવે છે, જે tmux સત્ર જીવંત છે કે નહીં, PR બનાવવામાં આવી છે કે નહીં, CI પસાર થયું કે નહીં તે તપાસે છે.
જો CI નિષ્ફળ જાય, તો એજન્ટને આપોઆપ પુનઃપ્રારંભ કરવામાં આવે છે, મહત્તમ 3 વખત ફરી પ્રયાસ કરે છે. ફક્ત જ્યારે માનવ હસ્તક્ષેપની જરૂર હોય ત્યારે જ સૂચના મોકલવામાં આવે છે.
એજન્ટ કાર્ય પૂર્ણ કર્યા પછી આપોઆપ PR બનાવે છે. પરંતુ ફક્ત PR બનાવવું પૂરતું નથી, એલ્વિસે પૂર્ણતા માટે એક સેટ ધોરણો વ્યાખ્યાયિત કર્યા છે: PR બનાવવું, શાખા મુખ્યમાં સમન્વયિત કરવી (કોઈ મર્જ વિવાદ નથી), CI સંપૂર્ણપણે પસાર થાય છે, ત્રણ AI મોડેલના કોડ સમીક્ષા સંપૂર્ણપણે પસાર થાય છે, જો UIમાં ફેરફાર હોય તો સ્ક્રીનશોટ પણ જોડવું જરૂરી છે.
ત્રણ AI મોડેલ કોડ સમીક્ષા કરે છે
ત્રણ AI મોડેલ કોડ સમીક્ષા કરે છે તે જોવા માટે ખૂબ જ મજબૂત લાગે છે. તે ત્રણ મોડેલ વિશેની તેની મૂલ્યાંકન વિશે વાત કરવી રસપ્રદ છે.
કોડેક્સ સમીક્ષક, તેણે સૌથી વધુ મૂલ્યાંકન કર્યું, કહ્યું કે તે સીમા પરના પરિસ્થિતિઓ અને તર્કની ભૂલોના સમીક્ષામાં ખૂબ જ વ્યાપક છે, ખોટા અહેવાલોની દર ખૂબ જ નીચી છે.
જેમિની કોડ સહાય સમીક્ષક, મફત, તેણે કહ્યું કે તે ખૂબ જ ઉપયોગી છે, અન્ય મોડેલો દ્વારા છૂટેલા સુરક્ષા જોખમો અને વિસ્તરણની સમસ્યાઓ શોધી શકે છે, અને ચોક્કસ સુધારણા યોજનાઓ આપી શકે છે.
ક્લોડ કોડ સમીક્ષક, તેની મૂળ વાત છે "મૂળભૂત રીતે ઉપયોગી નથી", તેણે કહ્યું કે તે વધુ સાવચેત છે, આખા સ્ક્રીન પર "વધુ ઉમેરવા પર વિચાર કરો..." જેવા સૂચનો છે, જેનો મોટાભાગનો ભાગ વધુ ડિઝાઇનમાં છે. જો તે મુખ્ય સમસ્યા તરીકે ચિહ્નિત ન થાય, તો તે સીધા જ છોડી દે છે.
જ્યારે મેં આ ભાગ જોયો ત્યારે હું થોડી આશ્ચર્યચકિત થયો. ક્લોડ કોડનો ભારે વપરાશકર્તા તરીકે, મેં ખરેખર કોડ સમીક્ષા કરતી વખતે તે ખૂબ જ સંકોચિત હોવાની સ્થિતિનો સામનો કર્યો છે, પરંતુ "મૂળભૂત રીતે ઉપયોગી નથી" આ મૂલ્યાંકન થોડું વધુ છે. પરંતુ આ પણ બાજુથી દર્શાવે છે કે, ઘણા મોડેલોના ક્રોસ સમીક્ષામાં ખરેખર મૂલ્ય છે, વિવિધ મોડેલોના પૂર્વગ્રહો એકબીજાને પૂરક છે.
ત્રણ સમીક્ષાઓ સંપૂર્ણપણે પસાર થયા પછી, એલ્વિસને ટેલિગ્રામ સૂચના મળે છે. આ તબક્કે, તે મુખ્યત્વે સ્ક્રીનશોટ પર નજર રાખે છે, UI ફેરફારો યોગ્ય છે કે નહીં તે પુષ્ટિ કરે છે, ઘણા PR તે કોડ જુઓ વિના જ સીધા મર્જ કરે છે. તેણે કહ્યું કે તેની માનવ સમીક્ષા માટે ફક્ત 5 થી 10 મિનિટની જરૂર છે.
ઝોઇની સક્રિયતા
ઝોઇ ફક્ત અમલકર્તા નથી. કાર્યપ્રવાહની તુલનામાં વધુ રસપ્રદ છે ઝોઇની સક્રિયતા.
એલ્વિસે કહ્યું કે ઝોઇ કાર્ય ફાળવવા માટે બેસી રહેતી નથી, તે સ્વતંત્ર રીતે કામ શોધે છે. સવારે સેંટ્રીની ભૂલની લોગ્સને સ્કેન કરે છે, 4 નવા ભૂલો શોધે છે, 4 એજન્ટોને સુધારવા માટે આપોઆપ બનાવે છે. બેઠક પછી બેઠકના નોંધો સ્કેન કરે છે, ગ્રાહકે ઉલ્લેખિત 3 કાર્યની જરૂરિયાતોને ચિહ્નિત કરે છે, પછી 3 કોડેક્સ એજન્ટોને આપોઆપ શરૂ કરે છે. સાંજના સમયે Git લોગને સ્કેન કરે છે, ક્લોડ કોડને changelog અને ગ્રાહક દસ્તાવેજને અપડેટ કરવા માટે શરૂ કરે છે.
એલ્વિસ બહાર જવા માટે નીકળે છે અને પાછા આવે છે, ટેલિગ્રામ પર એક સંદેશ છે: 7 PR તૈયાર છે, 3 નવા કાર્ય, 4 બગ સુધારણા. શું આ એ નથી જે હું હંમેશા OPC એક વ્યક્તિની કંપની વિકાસ ટીમના પરિણામો બનાવવા માટે આશા રાખતો હતો?અને જ્યારે એજન્ટ નિષ્ફળ જાય છે, ત્યારે ઝોઇની વ્યવહારિક રીત સરળ પુનરાયન કરતા વધુ ઉચ્ચ છે. તે વ્યવસાયિક સંદર્ભને સંયોજિત કરીને નિષ્ફળતાના કારણોનું વિશ્લેષણ કરે છે. એજન્ટ સંદર્ભ તૂટી ગયો? તે શ્રેણી ઘટાડશે, એજન્ટને માત્ર ત્રણ ફાઇલોમાં ધ્યાન કેન્દ્રિત કરવા માટે કહે છે. એજન્ટનો દિશા ખોટી થઈ ગઈ? તે પણ સુધારશે, એજન્ટને જણાવશે કે ગ્રાહકને X જોઈએ છે Y નહીં, અને બેઠકમાંના મૂળ શબ્દો સાથે જોડશે.
સમય સાથે, ઝોઇ અનુભવ એકત્રિત કરશે, યાદ રાખશે કે કયા પ્રોમ્પ્ટ બંધારણો કયા પ્રકારના કાર્ય માટે સારી રીતે કાર્ય કરે છે, અને આગામી વખત વધુ ચોક્કસ પ્રોમ્પ્ટ લખશે.
આ વિચારધારા વાસ્તવમાં રાલ્ફ લૂપનું અપગ્રેડેડ વર્ઝન છે. રાલ્ફ લૂપની મુખ્ય તર્કશક્તિ સંદર્ભ ખેંચવું, આઉટપુટ જનરેટ કરવું, પરિણામોનું મૂલ્યાંકન કરવું, અનુભવ સાચવવા માટેનો ચક્ર છે, પરંતુ મોટાભાગની અમલમાં દરેક ચક્ર માટેનો પ્રોમ્પ્ટ સ્થિર છે. એલ્વિસનો સિસ્ટમ અલગ છે, દરેક પુનરાયનમાં ઝોઇ નિષ્ફળતાના કારણો અનુસાર પ્રોમ્પ્ટને ગતિશીલ રીતે સમાયોજિત કરે છે, અને સંપૂર્ણ વ્યવસાયિક સંદર્ભ સાથે છે.
ખર્ચ અને હાર્ડવેર
ખર્ચના મામલે, એલ્વિસે જાહેર કરેલ માહિતી મુજબ ક્લોડ દર મહિને લગભગ 100 ડોલર, કોડેક્સ દર મહિને લગભગ 90 ડોલર છે. તેણે કહ્યું કે શરૂઆતમાં 20 ડોલરથી શરૂ કરી શકાય છે.
આ ખર્ચ એક ડેવલપરને ભાડે રાખવા કરતા ચોક્કસ રીતે સસ્તું છે. પરંતુ જો તમે તમારા ઉત્પાદક નિર્ણયો, ગ્રાહક સંવાદ, કોડ સમીક્ષા પણ કરવી પડશે, તો તે વધુ એક કાર્યક્ષમતા વધારક તરીકે લાગે છે, જે તમને કોડિંગ અને પરીક્ષણ જેવા પુનરાવૃત્તી ઉચ્ચ તબક્કાના તબક્કાઓમાંથી બચાવે છે.
હાર્ડવેરના મામલે, એલ્વિસે જણાવ્યું કે તેની સૌથી મોટી અવરોધ RAM છે. દરેક એજન્ટને સ્વતંત્ર વર્કટ્રીની જરૂર છે, દરેક વર્કટ્રીમાં પોતાનું નોડમોડ્યુલ્સ છે, દરેક એજન્ટને બાંધકામ, પ્રકારની તપાસ અને પરીક્ષણ ચલાવવાની જરૂર છે. 5 એજન્ટ એક સાથે ચલાવવાથી 5 સમકક્ષ ટાઇપસ્ક્રિપ્ટ સંકલક, 5 પરીક્ષણ ચલાવનાર, 5 સેટની નિર્ભરતા થાય છે.
તેનો મેક મિનિ 16GB મેમરીમાં વધુમાં વધુ 4 થી 5 એજન્ટો એક સાથે ચલાવી શકે છે, વધુમાં વધુ મેમરી સ્વાપ શરૂ થાય છે. તેથી તેણે 128GB મેમરી સાથેનો મેક સ્ટુડિયો M4 મૅક્સ (3500 ડોલર) ખરીદ્યો, વધુ એજન્ટોનું સમાનાં ચલાવવા માટે તેનો ઉપયોગ કરવાનો ઇરાદો છે.
સારાંશ અને વાસ્તવિક સમસ્યાઓ
સાચી વાત એ છે કે, એલ્વિસની આ સિસ્ટમ મને ખૂબ જ અસરિત કરી છે. હું અગાઉ ઓપનક્લોવને એક રમકડું માનતો હતો, ઉત્પાદનક્ષમતા બનાવવામાં, હું સ્વતંત્ર ક્લોડ કોડ પર આધાર રાખતો હતો. ક્યારેક વર્કટ્રીનો ઉપયોગ કરીને સમકક્ષ બનાવતો હતો, પરંતુ આ પ્રકારની સિસ્ટમિક ગોઠવણીના સ્તરે નથી. તેની ટ્વીટ વાંચ્યા પછી, મને લાગ્યું કે AI પ્રોગ્રામિંગનું છત ફરીથી ઉંચું થઈ ગયું છે.
હું તાજેતરમાં તેની વિચારધારાને અનુસરી રહ્યો છું, ઓપનક્લોવનો ઉપયોગ કરીને સંપૂર્ણ સ્વચાલિત એક વ્યક્તિના વિકાસ ટીમ બનાવવાનો ઇરાદો છે. તેથી, તાજેતરમાં અમે ઓપનક્લોવના અમલના લેખો પ્રકાશિત કરીશું.
કેટલાક વાસ્તવિક પ્રશ્નો છે જે大家ને યાદ રાખવા જોઈએ.
આ સિસ્ટમનો પૂર્વ શરત એ છે કે તમારે એક સ્પષ્ટ ઉત્પાદન, સ્પષ્ટ ગ્રાહકની જરૂરિયાતો, સંપૂર્ણ CI/CD પાઇપલાઇન હોવી જોઈએ. એલ્વિસ એક વાસ્તવિક B2B SaaS ઉત્પાદન બનાવી રહ્યો છે, ગ્રાહકો, આવક, ઉત્પાદન પર્યાવરણ છે. જો તમે હજુ ડેમો લખી રહ્યા છો અથવા શીખવાની તબક્કામાં છો, તો આ માળખાનું ROI કદાચ ખૂબ જ લાભદાયી નથી.
અન્યથા, ઓપનક્લોવની હાલની સુરક્ષા સમસ્યાઓ પર ધ્યાન આપવું પણ જરૂરી છે. જાહેર માહિતી મુજબ, ઘણા ઉચ્ચ જોખમના CVE જાહેર કરવામાં આવ્યા છે, અને 341 દૂષિત સમુદાય પ્લગઇન્સમાં ડેટા ચોરીની પ્રવૃત્તિઓ મળી આવી છે. ઓપનક્લોવને તૈનાત કરતી વખતે, અલગ અને અધિકાર નિયંત્રણ સારી રીતે કરવું જોઈએ. આ પણ એ કારણ છે કે હું હંમેશા ઓપનક્લોવને સ્થાનિક મુખ્ય મશીન પર તૈનાત નથી કર્યું.
અને એક બાબત, એલ્વિસે ટ્વીટમાં ક્લોડ કોડની કોડ સમીક્ષા પર નીચું મૂલ્યાંકન કર્યું છે, પરંતુ તાજેતરમાં ક્લોડ કોડ એજન્ટ ટીમો ફીચર (આધિકારી રીતે બિલ્ટ-ઇન મલ્ટી-એજન્ટ સહયોગ) રજૂ કર્યું છે, એન્થ્રોપિક પણ આ ગોઠવણીની દિશામાં કામ કરી રહ્યું છે.
પરંતુ આ વિગતોને છોડીને, એલ્વિસની આ ગોઠવણી સ્તર અને અમલ સ્તરના માળખાની વિચારધારા ખરેખર ધ્યાનમાં લેવાની છે. સંદર્ભ વિન્ડોની ઝીરો-સમ રમત વાસ્તવમાં અસ્તિત્વમાં છે, આ સમસ્યાને હલ કરવા માટે સ્તરીય માળખાનો ઉપયોગ કરવો, વિવિધ AI ને તેમના પોતાના કાર્યમાં નિષ્ણાત બનાવવું, આ દિશામાં હું વ્યક્તિગત રીતે સાચું માનું છું.[[HTMLPLACEHOLDER0]][[HTMLPLACEHOLDER1]][[HTMLPLACEHOLDER2]][[HTMLPLACEHOLDER_3]]

