OpenClaw + Claude Code/Codex:打造个人开发Agent Swarm

3/5/2026
9 min read

OpenClaw + Claude Code/Codex:打造个人开发Agent Swarm

Tere kõigile, mina olen Lu Gong.

Hiljuti nägin X-is ühte tweeti, mis kohe mu tähelepanu köitis. Üks iseseisev arendaja nimega Elvis ütles, et ta ei kasuta enam otseselt Claude Code'i ja Codexit, vaid on hakanud kasutama OpenClaw'd kui orkestreerimistaset, et lasta AI orkestreerijal nimega Zoe hallata kogu Claude Code'i ja Codexi Agent Swarmi.

See tweet oli ka andmete poolest muljetavaldav, 4,9 miljonit vaatamist, 11 tuhat meeldimist, 1800 jagamist.

Tweeti andmed Oleme Vibe Codingut kirjutanud üle nelja kuu, Claude Code on olnud meie peamine tööriist. Olen varem kirjutanud ka mitmest Agentide koostööst, VSCode'i mitme Agendi arhitektuurist ja muudest sarnastest artiklitest.

Kuid nähes Elvise lähenemist, ei saanud ma muud, kui tunnustada tema oskusi. Üks inimene, kasutades ühte orkestreerimissüsteemi, esitas keskmiselt 50 koodimuudatust päevas, kõige intensiivsemal päeval 94 muudatust, samal ajal võttes vastu 3 kliendi kõnet, ilma et ta oleks redaktorit kordagi avanud.

Kas see ei ole justkui üks inimene, kes toimib nagu terve arendustiim?

Täna vaatame lähemalt, kuidas ta seda saavutas.

OpenClaw pole kellelegi võõras

See väike vähk on alates eelmisest aastavahetusest olnud väga populaarne. Lihtsalt öeldes on see avatud lähtekoodiga AI Agendi raamistik, GitHubis on sellel juba üle 240 000 tähe ja paar päeva tagasi ületas see ametlikult Reacti, saades GitHubi ajaloo kiireima tähekasvu avatud projekti.

OpenClaw Asutaja Peter Steinberger on Austria arendaja, kes asutas varem PSPDFKit'i (PDF raamistik B2B ettevõtte jaoks) ja sai 2021. aastal Insight Partnersilt 100 miljoni euro suuruse investeeringu. Sel aastal veebruaris teatas Peter, et liitub OpenAI-ga ja OpenClaw projekt anti avatud lähtekoodiga sihtasutusele haldamiseks.

OpenClaw'i positsioon pole vestlusrobot, vaid AI Agendi käitusaeg, mis töötab teie kohalikel seadmetel. Sellel on neli põhikomponenti: Gateway (värav, mis ühendab üle 50 sõnumiplatvormiga), Agent (järeldusmootor), Skills (üle 5400 plugina) ja Memory (mälusüsteem).

Kuid Elvise kasutamine OpenClaw'ga on üsna eriline. Ta kasutab seda otse kui orkestreerimistaset, et hallata Claude Code'i ja Codexi kodeerimise Agente, mitte ei kasuta seda universaalse abina.

See mõte on tõeliselt ebatavaline.

Miks on vaja orkestreerimistaset?

Elvis tõi tweetis välja ühe väga olulise punkti: konteksti aken on nullsumma mäng.

Kui paned sinna koodi, ei jää ruumi äri konteksti jaoks. Kui paned sinna kliendi ajaloo ja koosoleku protokollid, ei jää ruumi koodide kogumile. Üksik AI, kui tugev see ka pole, ei suuda samaaegselt mahutada kahte täiesti erinevat tüüpi teavet.

Seetõttu jagas ta süsteemi kaheks tasemeks.

Ülemine tase on OpenClaw'i orkestreerija Zoe, kes haldab kogu äri konteksti, sealhulgas kliendi andmeid, koosoleku protokolle, ajaloolisi otsuseid, milliseid lahendusi on proovitud ja millised on ebaõnnestunud. Need andmed on kõik Elvise Obsidiani märkmete kogus, mida Zoe saab otse lugeda.

Alumine tase on Claude Code ja Codexi kodeerimise Agendid, kes vaatavad ainult koodi ja tegelevad ainult koodi kirjutamisega. Iga Agendi käivitamisel kirjutab Zoe äri konteksti põhjal sellele täpse ülesande, öeldes, mida teha, mis on taust ja mida klient soovib.

Lihtsalt öeldes: orkestreerija vastutab nõudmise mõistmise eest, kodeerimise Agent vastutab töö tegemise eest. Igaüks teeb oma ala asjatundlikkuse järgi.

See arhitektuur sarnaneb Stripe'i hiljuti avalikustatud sisemisele süsteemile Minions. Stripe'i Minions on samuti paralleelsed kodeerimise Agendid koos keskse orkestreerimistasemega, suudavad nad nädalas liita üle 1000 täielikult AI poolt kirjutatud PR-i. Elvis ütles, et ta lõi kogemata sarnase arhitektuuri, lihtsalt töötades oma Mac mini peal.

Tõeline juhtumite töövoog

Elvis kasutas tweetis tõelist juhtumit, et selgitada oma täielikku töövoogu, ma lühidalt kokkuvõtlen põhietapid.Ta võttis vastu kliendi kõne, klient soovis meeskonna sees olemasolevaid seadistusi taaskasutada. Kõne lõppedes rääkis ta Zoe'ga sellest vajadusest. Kuna kõik koosoleku protokollid sünkroonitakse automaatselt Obsidiani, teadis Zoe juba, mida klient ütles, ei olnud vaja, et Elvis lisaks veel seletaks. Nad määratlesid koos funktsionaalsuse ulatuse, lõplikuks lahenduseks sai mallide süsteemi loomine.

Seejärel tegi Zoe automaatselt kolm asja: laadis kliendile teenuse avamiseks raha (tal on administraatori API õigused), tõmbas tootmisandmebaasist kliendi olemasolevad seadistused (ainult lugemisõigused, koodigeneraatoril ei ole kunagi seda õigust), ja genereeris Codex Agendi, koos täieliku ärikonteksti sisaldava detailse prompt'iga.

Igal Agendil on oma iseseisev worktree (isoleeritud haru) ja tmux seanss. Käivitamise käsk on umbes selline:

# Loo worktree + käivita agent git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high"Agent käivitatakse, pärast seda on ajastatud ülesanne, mis kontrollib iga 10 minuti järel. Kuid see ei küsi otse Agendilt (see oleks liiga kulukas tokenite osas), vaid käivitab deterministliku Shell skripti, et kontrollida, kas tmux seanss on endiselt aktiivne, kas PR on loodud, ja kas CI on läbitud.

Kui CI ebaõnnestub, käivitab see Agendi automaatselt uuesti, maksimaalselt 3 korda. Ainult siis, kui on vajalik inimsekkumine, saadetakse teade.

Agent loob ülesande täitmisel automaatselt PR. Kuid ainult PR loomine ei ole veel kõik, Elvis on määratlenud lõpetamise standardi: PR loomine, haru sünkroniseerimine main'iga (ilma ühinemisprobleemideta), CI täielik läbitavus, kolme AI mudeli koodikontrolli täielik läbitavus, ja kui on UI muudatusi, peab olema lisatud ekraanipilt.

Kolm AI mudelit koodikontrolliks

Kolm AI mudelit koodikontrolliks näivad olevat väga usaldusväärsed. Räägime tema hinnangutest nende kolme mudeli kohta, see on üsna huvitav.

Codex Reviewer, tema hinnang on kõrgeim, ütles, et see kontrollib piiriolukordi ja loogika vigu väga põhjalikult, valehäirete määr on väga madal.

Gemini Code Assist Reviewer, tasuta, ütles, et see on väga kasulik, suudab tuvastada teistes mudelites tähelepanuta jäetud turvariske ja skaleeritavuse probleeme ning annab välja konkreetseid parandamise ettepanekuid.

Claude Code Reviewer, tema täpsed sõnad olid "peaaegu kasutu", ütles, et see on liiga ettevaatlik, täis soovitusi nagu "kaaluge lisamist...", enamik neist kuulub üleplaneerimise alla. Kui see ei ole märgitud kui kriitiline probleem, siis ta lihtsalt jätab selle vahele.

Kui ma seda lugesin, olin veidi üllatunud. Kui Claude Code'i intensiivne kasutaja, olen tõepoolest kohanud olukordi, kus see on koodikontrollis liiga ettevaatlik, kuid "peaaegu kasutu" hinnang on siiski veidi liialdatud. Kuid see näitab ka kaudselt, et mitme mudeli ristkontroll on tõepoolest väärtuslik, erinevate mudelite eelarvamused täiendavad üksteist.

Kui kõik kolm kontrolli on läbitud, saab Elvis alles siis Telegrami teate. Sellel etapil vaatab ta peamiselt ekraanipilte, et kinnitada, kas UI muudatused on õiged, paljusid PR-e ta ei vaata koodi ja liidab need otse. Ta ütles, et tema inimkontroll võtab vaid 5 kuni 10 minutit.

Zoe initsiatiiv

Zoe ei ole ainult teostaja. Töövoost huvitavam on Zoe initsiatiiv.

Elvis ütles, et Zoe ei istu lihtsalt ja oota, et talle ülesandeid jagataks, vaid otsib aktiivselt tööd. Hommikul skaneerib ta Sentry vealogisid, avastab 4 uut viga, genereerib automaatselt 4 Agenti nende parandamiseks. Koosoleku lõppedes skaneerib ta koosoleku protokolle, märgib üles kliendi mainitud 3 funktsionaalsuse vajadust, ja käivitab automaatselt 3 Codex Agenti. Õhtul skaneerib ta Git logisid, käivitab Claude Code'i, et uuendada changelog'i ja kliendidokumente.

Elvis läheb jalutama ja naastes on Telegramis sõnum: 7 PR-i on valmis, 3 uut funktsiooni, 4 vea parandust. Kas see ei ole just see, mida ma olen alati soovinud, et luua OPC üksi töötava arendustiimi efektiivsus?Ja kui Agent ebaõnnestub, on Zoe käsitsemine palju arenenum kui lihtsalt uuesti proovimine. Ta analüüsib ebaõnnestumise põhjuseid, ühendades ärikonteksti. Kas Agent konteksti kaotas? Ta kitsendab fookust, lastes Agentil keskenduda ainult kolmele failile. Kas Agent on vale suunas? Ta parandab seda, öeldes Agentile, et klient soovib X-i, mitte Y-d, ja lisab koosoleku originaalsõnad.

Aja jooksul kogub Zoe ka kogemusi, mäletades, millised prompt-struktuurid toimivad milliste ülesannete puhul hästi, et järgmisel korral kirjutada täpsemat prompti.

See mõte on tegelikult Ralph Loop'i uuendatud versioon. Ralph Loop'i põhiloogika on konteksti tõmbamine, väljundi genereerimine, tulemuste hindamine ja kogemuste salvestamine, kuid enamik rakendusi kasutab iga tsükli jaoks fikseeritud prompti. Elvis'e süsteem on erinev, iga kord, kui Zoe uuesti proovib, kohandab ta prompti dünaamiliselt vastavalt ebaõnnestumise põhjusele, ja tal on täielik ärikontekst toetuseks.

Kulud ja riistvara

Kulude osas on Elvis'e avaldatud andmed, et Claude maksab umbes 100 dollarit kuus, Codex umbes 90 dollarit kuus. Ta mainis ka, et alustamiseks võib proovida alustada 20 dollarist.

See hind on loomulikult naeruväärselt odav võrreldes arendaja palkamisega. Kuid kui arvestada, et pead ise tegema tooteotsuseid, kliendisuhtlust ja koodide ülevaatamist, on see pigem efektiivsuse suurendaja, mis aitab sul säästa koodi kirjutamise ja testimise korduvaid etappe.

Riistvara osas mainis Elvis, et tema suurim kitsaskoht on RAM. Iga Agent vajab iseseisvat tööpuud, igal tööpuul on oma node_modules, iga Agent peab jooksma ehitust, tüübikontrolli ja teste. 5 Agent'i samaaegne käitamine tähendab 5 paralleelset TypeScript'i kompilaatorit, 5 testijate jooksutajat, 5 sõltuvuste komplekti.

Tema Mac mini 16GB mäluga suudab korraga jooksutada maksimaalselt 4-5 Agent'i, rohkem tähendab mälus vahetamist. Seetõttu ostis ta 128GB mäluga Mac Studio M4 Max (3500 dollarit), et tal oleks võimalik taluda rohkem Agent'ide samaaegset tööd.

Kokkuvõte ja reaalsed probleemid

Ausalt öeldes, Elvis'e süsteem on mulle tõeliselt muljet avaldanud. Olen varem OpenClaw'd mänguasjana kasutanud, tootlikkuse osas olen alati sõltunud iseseisvast Claude Code'ist. Aeg-ajalt kasutan tööpuud paralleelselt, kuid mitte kaugeltki sellise süsteemse korralduse tasemeni. Pärast tema tweetide lugemist tunnen, et AI programmeerimise piire on taas tõstetud.

Viimasel ajal olen ma tema mõtteviisi järgides valmis OpenClaw'd kasutama täielikult automatiseeritud ühe arendaja meeskonna loomiseks. Seega, lähiajal avaldame mitmeid OpenClaw'i praktikaartikleid.

On mõned reaalsed probleemid, millest tuleks teavitada.

Selle süsteemi eeltingimus on, et sul peab olema selge toode, selged kliendinõudmised ja toimiv CI/CD voog. Elvis töötab reaalse B2B SaaS toote kallal, tal on kliendid, sissetulek ja tootmis keskkond. Kui sa alles kirjutad Demo või õpid, ei pruugi selle arhitektuuri ROI olla väga tasuv.

Lisaks tuleb tähelepanu pöörata OpenClaw'i praegustele turvaprobleemidele. Avalike andmete kohaselt on juba mitmeid kõrge riskiga CVE-sid avalikustatud ning 341 pahatahtlikku kogukonna plugina on leitud andmete varguse käitumisega. OpenClaw'i juurutamisel tuleb kindlasti teha isolatsiooni ja õiguste kontrolli. See on ka põhjus, miks ma pole OpenClaw'd oma peamasinas juurutanud.

Veel üks asi, Elvis hindas tweetides Claude Code'i koodide ülevaatust madalalt, kuid hiljuti on Claude Code just käivitanud Agent Teams funktsiooni (ametlikult sisseehitatud mitme Agent'i koostöö), Anthropic töötab ka selle suuna suunas.

Kuid kõrvale jättes need detailid, Elvis'e arhitektuuri mõte, mis ühendab korraldamise ja täitmise taseme, on tõeliselt tähelepanuväärne. Konteksti akna nullsumma mäng on tõeline piirang, ja selle probleemi lahendamine kihilise arhitektuuri abil, lastes erinevatel AI-del oma ülesandeid täita, on minu arvates õige suund....

Published in Technology

You Might Also Like