OpenClaw + Claude Code/Codex: Vytvoření osobního vývojového agentního roje

Ahoj všichni, jsem Lu Gong.

Nedávno jsem na X narazil na tweet, který mě okamžitě zaujal. Nezávislý vývojář jménem Elvis říkal, že už přímo nepoužívá Claude Code a Codex, ale místo toho používá OpenClaw jako vrstvu orchestrace, aby spravoval celý roj agentů Claude Code a Codex pomocí AI orchestrace jménem Zoe.

Data z tohoto tweetu jsou také ohromující, 4,9 milionu zhlédnutí, 11 tisíc lajků, 1800 retweetů.

Naše číslo Vibe Coding píšeme už více než čtyři měsíce, Claude Code byl vždy hlavním nástrojem. Dříve jsem také psal několik článků o spolupráci více agentů, architektuře více agentů ve VSCode a podobně.

Ale když jsem viděl Elvisovu metodu, nemohl jsem si pomoci, ale musel jsem uznat, že je to odborník. Jeden člověk, s jedním systémem orchestrace, průměrně 50 kódových příspěvků denně, v nejlepším dni odevzdal 94 příspěvků, přijal 3 telefonáty od klientů a editor ani jednou neotevřel.

To není jako by jeden člověk zastupoval celý vývojový tým?

Dneska se podíváme na to, jak to vlastně dokázal.

OpenClaw je už známý

Tento malý rak je od před Čínského Nového roku stále populární. Zjednodušeně řečeno, je to open-source rámec AI agentů, na GitHubu má již více než 240 tisíc hvězdiček a před dvěma dny oficiálně překonal React, čímž se stal open-source projektem s nejrychlejším nárůstem hvězdiček v historii GitHubu.

Zakladatel Peter Steinberger je rakouský vývojář, který dříve založil PSPDFKit (B2B společnost pro PDF rámec), v roce 2021 získal investici 100 milionů eur od Insight Partners. V únoru tohoto roku Peter oznámil, že se připojil k OpenAI a projekt OpenClaw byl předán k provozu open-source nadaci.

OpenClaw není chatbot, je to AI agent runtime běžící na vašem místním zařízení. Má čtyři hlavní komponenty: Gateway (brána, která spojuje více než 50 zprávových platforem), Agent (inference engine), Skills (více než 5400 pluginů), Memory (paměťový systém).

Ale Elvis používá OpenClaw poněkud zvláštním způsobem. Přímo ho používá jako vrstvu orchestrace, speciálně pro správu kódových agentů jako Claude Code a Codex, a ne jako univerzálního asistenta.

Tento přístup je opravdu neobvyklý.

Proč potřebujeme vrstvu orchestrace?

Elvis v tweetu zmínil velmi klíčový bod: okno kontextu je hra s nulovým součtem.

Když do něj vložíte kód, nezbývá místo na obchodní kontext. Když do něj vložíte historii klientů a zápisy ze schůzek, nezbývá místo na kódovou základnu. I ten nejsilnější AI nemůže současně pojmout dva zcela odlišné typy informací.

Proto rozdělil systém na dvě vrstvy.

Horní vrstva je orchestrátor OpenClaw jménem Zoe, která ovládá veškerý obchodní kontext, včetně dat klientů, zápisů ze schůzek, historických rozhodnutí, které návrhy byly vyzkoušeny, a které selhaly. Tyto informace jsou uloženy v Elvisově poznámkovém systému Obsidian, ze kterého může Zoe přímo číst.

Dolní vrstva jsou kódoví agenti jako Claude Code a Codex, kteří se dívají pouze na kód a starají se pouze o psaní kódu. Když se každý agent spustí, Zoe mu na základě obchodního kontextu napíše přesný prompt, který mu říká, co má dělat, jaký je kontext a co klient požaduje.

Zjednodušeně řečeno: orchestrátor je zodpovědný za pochopení požadavků, kódoví agenti jsou zodpovědní za práci. Každý dělá to, co umí nejlépe.

Tato architektura je podobná internímu systému Minions, který nedávno zveřejnil Stripe. Minions od Stripe jsou také designem paralelních kódových agentů s centralizovanou vrstvou orchestrace, která dokáže sloučit více než 1000 PR napsaných výhradně AI každý týden. Elvis říká, že náhodou vytvořil podobnou architekturu, jen běžící na jeho Mac mini.

Skutečný pracovní tok případu

Elvis v tweetu použil skutečný případ, aby popsal svůj kompletní pracovní tok, já jsem shrnul klíčové kroky.On přijal telefonát od klienta, který chtěl znovu použít stávající konfiguraci v rámci týmu. Po skončení hovoru si o této potřebě promluvil se Zoe. Protože všechny zápisy z jednání se automaticky synchronizují do Obsidianu, Zoe už věděla, co klient říkal, a Elvis nemusel nic dodatečně vysvětlovat. Společně určili rozsah funkcionality a konečným řešením bylo vytvoření systému šablon.

Poté Zoe automaticky provedla tři věci: dobila klientovi službu odemčení (má administrátorská API oprávnění), stáhla stávající konfiguraci klienta z produkční databáze (pouze pro čtení, kódovací Agent nikdy nebude mít toto oprávnění) a poté vygenerovala Codex Agenta, který měl podrobný prompt obsahující kompletní obchodní kontext.

Každý Agent má svůj vlastní nezávislý worktree (izolovaná větev) a tmux relaci. Spouštěcí příkaz vypadá přibližně takto:

# Vytvoření worktree + spuštění agenta git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high Po spuštění Agenta existuje naplánovaná úloha, která každých 10 minut provádí kontrolu. Ale neptá se přímo Agenta (to by příliš zatěžovalo tokeny), místo toho spouští deterministický Shell skript, který kontroluje, zda je tmux relace stále aktivní, zda byla vytvořena PR a zda CI prošlo.

Pokud CI selže, Agent se automaticky restartuje, maximálně 3 pokusy. Oznámení se posílá pouze v případě, že je potřeba lidského zásahu.

Po dokončení úkolu Agent automaticky vytvoří PR. Ale pouze vytvoření PR nestačí, Elvis definoval sadu standardů pro dokončení: vytvoření PR, synchronizace větve do main (bez konfliktů při sloučení), CI musí projít, kódová revize tří AI modelů musí projít, a pokud došlo ke změnám v UI, musí být přiloženy screenshoty.

Tři AI modely provádějí kódovou revizi

Tři AI modely provádějící kódovou revizi vypadají velmi stabilně. Je zajímavé si promluvit o jeho hodnocení těchto tří modelů.

Codex Reviewer, ten hodnotil nejvýše, říkal, že jeho revize je velmi důkladná, pokud jde o okrajové případy a logické chyby, a má velmi nízkou míru falešných poplachů.

Gemini Code Assist Reviewer, zdarma, říkal, že je velmi užitečný, dokáže odhalit bezpečnostní rizika a problémy s rozšiřitelností, které ostatní modely přehlédly, a také poskytuje konkrétní návrhy na opravy.

Claude Code Reviewer, jeho slova byla "v podstatě k ničemu", říkal, že je příliš opatrný, plný návrhů jako "zvažte přidání...", většina z nich patří do kategorie nadměrného designu. Pokud není označeno jako kritický problém, rovnou to přeskočí.

Když jsem to četl, byl jsem trochu překvapen. Jakožto intenzivní uživatel Claude Code jsem se skutečně setkal s tím, že byl při kódové revizi příliš konzervativní, ale hodnocení "v podstatě k ničemu" je přece jen trochu přehnané. To však také naznačuje, že křížová revize pomocí více modelů má skutečně hodnotu, předsudky různých modelů se navzájem doplňují.

Až budou všechny tři revize schváleny, Elvis obdrží oznámení na Telegramu. V této fázi se zaměřuje hlavně na screenshoty, aby potvrdil, že změny v UI jsou správné, mnoho PR sloučí, aniž by se na kód podíval. Říká, že jeho ruční revize trvá pouze 5 až 10 minut.

Zoeina iniciativa

Zoe není jen vykonavatelka. Zajímavější než samotný pracovní tok je Zoeina iniciativa.

Elvis říká, že Zoe nečeká, až jí budou přiděleny úkoly, ale aktivně hledá práci. Ráno prohledává chyby v Sentry, zjistí 4 nové chyby a automaticky vytvoří 4 Agenty, aby je opravily. Po schůzce prochází zápisy z jednání, označí 3 funkční požadavky zmíněné klientem a poté automaticky spustí 3 Codex Agenty. Večer prochází Git logy a spouští Claude Code, aby aktualizoval changelog a dokumentaci pro klienta.

Když se Elvis vrátí z procházky, na Telegramu má zprávu: 7 PR je připraveno, 3 nové funkce, 4 opravy chyb. To není přesně to, co jsem vždy chtěl vytvořit jako efekt jednočlenného vývojového týmu OPC?A když Agent selže, Zoeho způsob zpracování je mnohem pokročilejší než jednoduché opakování. Analyzuje důvody selhání v kontextu podnikání. Kontext Agenta selhal? Zúží rozsah a nechá Agenta soustředit se pouze na tři soubory. Směr Agenta se odchýlil? Opraveno, řekne Agentovi, že zákazník chce X, nikoli Y, a přiloží původní slova z jednání.

S časem Zoe také hromadí zkušenosti, pamatuje si, které struktury promptů fungují dobře pro jaké úkoly, a příště napíše přesnější prompt.

Tento přístup je vlastně vylepšenou verzí Ralph Loop. Hlavní logika Ralph Loop spočívá v cyklu, který zahrnuje stahování kontextu, generování výstupu, hodnocení výsledků a ukládání zkušeností, ale většina implementací má pro každý cyklus pevný prompt. Elvisův systém je jiný, při každém opakování Zoe dynamicky upravuje prompt na základě důvodů selhání a má k dispozici kompletní kontext podnikání.

Náklady a hardware

Pokud jde o náklady, veřejně dostupná data od Elvise uvádějí, že Claude stojí přibližně 100 dolarů měsíčně a Codex přibližně 90 dolarů měsíčně. Také zmínil, že můžete začít zkoušet s 20 dolary.

Tyto náklady jsou samozřejmě směšně nízké ve srovnání s najímáním vývojáře. Ale pokud vezmete v úvahu, že musíte také dělat produktová rozhodnutí, komunikaci se zákazníky a revizi kódu, spíše se to podobá zesilovači efektivity, který vám ušetří opakující se úkoly, jako je kódování a testování.

Pokud jde o hardware, Elvis zmínil, že jeho největším omezením je RAM. Každý Agent potřebuje nezávislý worktree, každý worktree má své vlastní nodemodules, každý Agent musí spouštět sestavení, kontrolu typů a testy. 5 Agentů běžících současně znamená 5 paralelních TypeScript kompilátorů, 5 testovacích běžců a 5 sad závislostí.

Jeho Mac mini s 16 GB RAM zvládne maximálně 4 až 5 Agentů současně, víc už začíná vyžadovat výměnu paměti. Takže si koupil Mac Studio M4 Max s 128 GB RAM (3500 dolarů), aby zvládl více souběžných Agentů.

Shrnutí a reálné problémy

Upřímně řečeno, Elvisův systém na mě udělal velký dojem. Dříve jsem OpenClaw považoval za hračku, při zvyšování produktivity jsem se spoléhal na nezávislý Claude Code. Občas jsem používal worktree pro paralelní úkoly, ale rozhodně ne na úrovni této systematické orchestrace. Po přečtení jeho tweetu jsem měl pocit, že strop AI programování byl opět posunut výše.

V poslední době se chystám podle jeho myšlenek vytvořit s OpenClaw plně automatizovaný tým jednoho vývojáře. Takže brzy zveřejníme několik článků o praktikách OpenClaw.

Existuje několik reálných problémů, na které bych chtěl upozornit.

Tento systém předpokládá, že máte jasný produkt, jasné požadavky zákazníků a dobře fungující CI/CD pipeline. Elvis pracuje na skutečném B2B SaaS produktu, má zákazníky, příjmy a produkční prostředí. Pokud stále píšete demo nebo jste ve fázi učení, návratnost investice tohoto rámce nemusí být příliš výhodná.

Dále je třeba věnovat pozornost aktuálním bezpečnostním problémům OpenClaw. Podle veřejných informací bylo zveřejněno několik vysoce rizikových CVE a bylo objeveno 341 škodlivých komunitních pluginů, které vykazovaly chování krádeže dat. Při nasazení OpenClaw je důležité zajistit izolaci a kontrolu oprávnění. To je také důvod, proč jsem OpenClaw dosud nenainstaloval na svůj hlavní počítač.

A ještě jedna věc, Elvis v tweetu hodnotil revizi kódu Claude Code jako nízkou, ale nedávno byla představena funkce Agent Teams (oficiálně integrovaná spolupráce více Agentů) a Anthropic se také snaží v této oblasti posunout vpřed.

Ale pokud odhlédneme od těchto detailů, Elvisova architektura orchestrace a vykonávání je skutečně pozoruhodná. Nulová suma kontextového okna je skutečným omezením, a použití vícestupňové architektury k vyřešení tohoto problému, aby různé AI plnily své úkoly, je podle mého názoru správný směr.[[HTMLPLACEHOLDER_0]]