OpenClaw + Claude Code/Codex: Vytvorenie osobného vývojového Agent Swarm

Ahojte, ja som Lu Gong.

Nedávno som na X narazil na tweet, ktorý ma okamžite zaujal. Nezávislý vývojár menom Elvis povedal, že už priamo nepoužíva Claude Code a Codex, ale namiesto toho používa OpenClaw ako orchestráciu, aby AI orchestrátor menom Zoe spravoval celú skupinu agentov Claude Code a Codex.

Dáta z tohto tweetu sú tiež ohromujúce, 4,9 milióna zobrazení, 11 tisíc lajkov, 1800 zdieľaní.

Naša stránka Vibe Coding existuje už viac ako štyri mesiace a Claude Code bol vždy naším hlavným nástrojom. Predtým som napísal niekoľko článkov o spolupráci viacerých agentov, architektúre viacerých agentov vo VSCode a podobne.

Ale keď som videl Elvisovu metódu, mohol som len povedať, že je to odborník. Jeden človek, s jedným orchestrálnym systémom, priemerne 50 kódových príspevkov denne, v najlepšom dni 94 príspevkov, a prijal tri telefonáty od klientov, ani raz neotvoril editor.

To nie je ako keby jeden človek fungoval ako celý vývojový tím?

Dnes sa v tomto článku pozrieme na to, ako to vlastne dokázal.

OpenClaw je už známy

Tento malý rak pred Čínskym Novým rokom bol stále populárny. Jednoducho povedané, je to open-source AI agent rámec, ktorý na GitHub-e už prekonal 240 000 hviezdičiek a pred pár dňami oficiálne prekonal React, čím sa stal open-source projektom s najrýchlejším rastom hviezdičiek v histórii GitHub-u.

Zakladateľ Peter Steinberger je rakúsky vývojár, predtým založil PSPDFKit (B2B spoločnosť pre PDF rámec), v roku 2021 získal investíciu vo výške 100 miliónov eur od Insight Partners. V februári tohto roku Peter oznámil, že sa pripojil k OpenAI a projekt OpenClaw bol odovzdaný na prevádzku open-source nadácii.

OpenClaw nie je chatbot, je to AI agent runtime, ktorý beží na vašom lokálnom zariadení. Má štyri základné komponenty: Gateway (brána, ktorá sa pripája na viac ako 50 komunikačných platforiem), Agent (informačný motor), Skills (viac ako 5400 pluginov), Memory (pamäťový systém).

Ale Elvis používa OpenClaw trochu inak. Priamo ho používa ako orchestráciu, špeciálne na správu kódovacích agentov Claude Code a Codex, a nepoužíva ho ako univerzálneho asistenta.

Tento prístup je naozaj nezvyčajný.

Prečo potrebujeme orchestráciu?

Elvis vo svojom tweete uviedol veľmi kľúčový názor: Okno kontextu je nulová suma.

Ak do neho vložíte kód, nezostáva miesto na obchodný kontext. Ak tam vložíte históriu klientov a zápisnice zo stretnutí, nezostáva miesto na kódovú základňu. Ani najlepší AI nemôže súčasne spracovať tieto dva úplne odlišné typy informácií.

Preto rozdelil systém na dve úrovne.

Horná úroveň je orchestrátor OpenClaw, Zoe, ktorá ovláda všetok obchodný kontext, vrátane údajov o klientoch, zápisníc zo stretnutí, historických rozhodnutí, ktoré riešenia boli vyskúšané a ktoré zlyhali. Tieto informácie sú uložené v Elvisovom Obsidian poznámkovom systéme, ktorý môže Zoe priamo čítať.

Dolná úroveň sú kódoví agenti Claude Code a Codex, ktorí sa zaoberajú len kódom, len píšu kód. Pri spustení každého agenta, Zoe na základe obchodného kontextu napíše presný prompt, ktorý mu povie, čo má robiť, aké je pozadie a čo klient požaduje.

Jednoducho povedané: orchestrátor je zodpovedný za pochopenie požiadaviek, kódovací agent je zodpovedný za prácu. Každý robí to, čo mu ide najlepšie.

Táto architektúra je podobná internému systému Minions, ktorý nedávno zverejnil Stripe. Minions od Stripe sú tiež dizajnom paralelných kódovacích agentov s centralizovanou orchestráciou, schopní zlúčiť viac ako 1000 PR úplne napísaných AI za týždeň. Elvis povedal, že náhodou vytvoril podobnú architektúru, len beží na jeho Mac mini.

Skutočný prípad pracovného toku

Elvis vo svojom tweete použil skutočný prípad na vysvetlenie svojho kompletného pracovného toku, ja som jednoducho zhrnul kľúčové kroky.On prijal telefonát od klienta, ktorý chcel znovu použiť existujúce nastavenia v tíme. Po ukončení hovoru sa porozprával so Zoe o tejto požiadavke. Pretože všetky zápisy zo schôdzí sa automaticky synchronizujú do Obsidianu, Zoe už vedela, čo klient povedal, a Elvis nemusel nič dodatočne vysvetľovať. Spoločne určili rozsah funkcií a konečné riešenie bolo vytvoriť systém šablón.

Potom Zoe automaticky vykonala tri veci: dobila klientovi službu odomknutia (má administrátorské API oprávnenia), stiahla existujúce nastavenia klienta z produkčnej databázy (iba na čítanie, kódovací agent nikdy nebude mať toto oprávnenie), a potom vytvorila Codex agenta s podrobným promptom obsahujúcim kompletný obchodný kontext.

Každý agent má svoj vlastný nezávislý worktree (izolovaná vetva) a tmux reláciu. Príkaz na spustenie vyzerá asi takto:

# Vytvorenie worktree + spustenie agenta git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high Po spustení agenta existuje naplánovaná úloha, ktorá každých 10 minút kontroluje stav. Ale neoslovuje priamo agenta (to by príliš zaťažovalo tokeny), ale spúšťa deterministický Shell skript, ktorý kontroluje, či je tmux relácia stále aktívna, či bol vytvorený PR a či CI prešiel.

Ak CI zlyhá, agent sa automaticky reštartuje, maximálne 3 pokusy. Oznámenie sa posiela len v prípade, že je potrebný zásah človeka.

Po dokončení úlohy agent automaticky vytvorí PR. Ale len vytvorenie PR nestačí, Elvis definoval súbor kritérií dokončenia: PR vytvorený, vetva synchronizovaná s main (bez konfliktov pri zlúčení), CI prešiel všetkými testami, kódové kontroly všetkých troch AI modelov prešli, a ak došlo k zmene UI, musia byť priložené snímky obrazovky.

Tri AI modely robia kódové kontroly

Tri AI modely robia kódové kontroly vyzerajú veľmi stabilne. Je zaujímavé, aké má hodnotenie týchto troch modelov.

Codex Reviewer, jeho hodnotenie je najvyššie, hovorí, že kontrola v okrajových prípadoch a logických chybách je veľmi dôkladná, miera falošných poplachov je veľmi nízka.

Gemini Code Assist Reviewer, zadarmo, hovorí, že je veľmi praktický, dokáže odhaliť bezpečnostné riziká a problémy s rozšíriteľnosťou, ktoré iné modely prehliadli, a dokáže poskytnúť konkrétne návrhy na opravy.

Claude Code Reviewer, jeho presné slová sú "v podstate nepoužiteľný", hovorí, že je príliš opatrný, plný návrhov ako "zvážte pridanie...", väčšina z nich patrí k nadmernému dizajnu. Pokiaľ nie je označený ako kritický problém, jednoducho to preskočí.

Keď som to čítal, bol som trochu prekvapený. Ako intenzívny používateľ Claude Code som sa naozaj stretol s jeho príliš opatrným prístupom pri kódových kontrolách, ale hodnotenie "v podstate nepoužiteľný" je trochu prehnané. Ale to tiež naznačuje, že krížové kontroly s viacerými modelmi majú naozaj hodnotu, predsudky rôznych modelov sa navzájom dopĺňajú.

Až po tom, čo všetky tri kontroly prešli, dostane Elvis oznámenie na Telegrame. V tejto fáze sa zameriava hlavne na snímky obrazovky, aby potvrdil, či sú zmeny UI správne, veľa PR priamo zlúči bez toho, aby sa pozrel na kód. Hovorí, že jeho manuálna kontrola trvá iba 5 až 10 minút.

Zoeina iniciatíva

Zoe nie je len vykonávateľka. Zaujímavejšia než samotný pracovný tok je iniciatíva Zoe.

Elvis hovorí, že Zoe nečaká, kým jej pridelia úlohu, ale aktívne hľadá prácu. Ráno skenuje chybové protokoly Sentry, zistí 4 nové chyby a automaticky vytvorí 4 agentov na opravu. Po schôdzi skenuje zápisy zo schôdzí, označí 3 funkčné požiadavky, ktoré klient spomenul, a potom automaticky spustí 3 Codex agentov. Večer skenuje Git protokoly a spúšťa Claude Code na aktualizáciu changelogu a dokumentácie pre klienta.

Keď sa Elvis vráti z prechádzky, na Telegrame má správu: 7 PR je pripravených, 3 nové funkcie, 4 opravy chýb. To nie je presne to, čo som vždy očakával, že vytvorím v OPC, jednočlenný vývojový tím.A keď Agent zlyhá, Zoeho prístup je oveľa sofistikovanejší ako jednoduché opakovanie. Kombinuje analýzu obchodného kontextu na zistenie dôvodov zlyhania. Kontext Agenta sa pretrhol? Zúži rozsah a nechá Agenta sústrediť sa len na tri súbory. Agent sa odklonil? Opraviť to a povedať Agentovi, že zákazník chce X, nie Y, a priložiť pôvodné slová z porady.

S časom Zoe tiež akumuluje skúsenosti, pamätá si, ktoré štruktúry promptov fungujú dobre pre aké úlohy, a nabudúce napíše presnejší prompt.

Tento prístup je vlastne vylepšenou verziou Ralph Loop. Hlavná logika Ralph Loop spočíva v cykle, ktorý zahŕňa ťahanie kontextu, generovanie výstupu, hodnotenie výsledkov a ukladanie skúseností, ale väčšina implementácií má každý cyklus s fixným promptom. Elvisov systém je iný, pri každom opakovaní Zoe dynamicky upravuje prompt na základe dôvodov zlyhania a má kompletný obchodný kontext na podporu.

Náklady a hardvér

Pokiaľ ide o náklady, Elvis uviedol, že Claude stojí približne 100 dolárov mesačne a Codex okolo 90 dolárov mesačne. Tiež povedal, že môžete začať s 20 dolármi na vyskúšanie.

Tieto náklady sú samozrejme smiešne lacné v porovnaní s nájmom vývojára. Ale ak zohľadníte, že musíte robiť aj produktové rozhodnutia, komunikáciu so zákazníkmi a kontrolu kódu, je to skôr efektívny zosilňovač, ktorý vám ušetrí čas na kódovanie a testovanie, čo sú najviac opakujúce sa úlohy.

Pokiaľ ide o hardvér, Elvis spomenul, že jeho najväčším obmedzením je RAM. Každý Agent potrebuje nezávislý worktree, každý worktree má svoje vlastné node_modules, každý Agent musí spustiť zostavenie, typovú kontrolu a testovanie. 5 Agentov bežiacich súčasne znamená 5 paralelných TypeScript kompilátorov, 5 testovacích bežcov a 5 súborov závislostí.

Jeho Mac mini s 16 GB RAM dokáže súčasne spustiť maximálne 4 až 5 Agentov, viac už začína spôsobovať výmenu pamäte. Preto si kúpil Mac Studio M4 Max s 128 GB RAM (3500 dolárov), aby mohol zvládnuť viac súbežných Agentov.

Zhrnutie a reálne problémy

Úprimne povedané, Elvisov systém ma naozaj prekvapil. Predtým som OpenClaw považoval za hračku, pri zvyšovaní produktivity som sa spoliehal na nezávislý Claude Code. Občas som používal worktree na paralelné spracovanie, ale ani zďaleka nie na úrovni systematického usporiadania. Po prečítaní jeho tweetov som cítil, že strop AI programovania bol opäť posunutý vyššie.

V poslednej dobe sa snažím podľa jeho myšlienok vytvoriť úplne automatizovaný tím jedného vývojára pomocou OpenClaw. Takže v blízkej budúcnosti plánujeme publikovať viacero praktických článkov o OpenClaw.

Existuje niekoľko reálnych problémov, na ktoré by som vás chcel upozorniť.

Tento systém predpokladá, že máte jasný produkt, presne definované požiadavky zákazníka a dobre fungujúci CI/CD pipeline. Elvis pracuje na skutočnom B2B SaaS produkte, má zákazníkov, príjmy a produkčné prostredie. Ak ste ešte v štádiu písania demo alebo učenia, návratnosť investícií tejto architektúry nemusí byť výhodná.

Okrem toho je potrebné venovať pozornosť aj súčasným bezpečnostným problémom OpenClaw. Podľa verejných informácií už bolo zverejnených niekoľko vysokorizikových CVE a bolo objavených 341 škodlivých komunitných pluginov, ktoré vykazovali správanie krádeže údajov. Pri nasadzovaní OpenClaw je dôležité zabezpečiť izoláciu a kontrolu oprávnení. To je tiež dôvod, prečo som OpenClaw doteraz nenainštaloval na svoj hlavný počítač.

Ešte jedna vec, Elvis vo svojich tweetoch hodnotil kontrolu kódu Claude Code ako nízku, ale nedávno Claude Code práve spustil funkciu Agent Teams (oficiálne zabudovaná spolupráca viacerých Agentov), Anthropic sa tiež snaží posunúť sa týmto smerom.

Ale odhliadnuc od týchto detailov, Elvisova architektúra s vrstvou orchestrácie a vykonávania naozaj stojí za pozornosť. Nulová suma kontextového okna je skutočne existujúcim obmedzením, a použitie vrstvenej architektúry na riešenie tohto problému, aby rôzne AI plnili svoje úlohy, je podľa mňa správny smer....