OpenClaw + Claude Code/Codex：Izrada osobnog razvojnog Agent Swarm

Pozdrav svima, ja sam Lu Gong.

Nedavno sam na X-u naišao na jedan tweet koji me odmah privukao. Nezavisni programer po imenu Elvis rekao je da više ne koristi direktno Claude Code i Codex, već koristi OpenClaw kao sloj orkestracije, dopuštajući AI orkestratoru po imenu Zoe da upravlja cijelim Claude Code i Codex Agent Swarm-om.

Podaci iz ovog tweeta su također impresivni, 4,9 milijuna pregleda, 11 tisuća lajkova, 1800 dijeljenja.

Naš račun piše Vibe Coding već više od četiri mjeseca, a Claude Code je bio naš glavni alat. Prije sam također pisao nekoliko članaka o suradnji više agenata, VSCode arhitekturi više agenata i slično.

Ali kada sam vidio Elvisov način rada, mogao sam samo reći da je to zaista profesionalno. Jedna osoba, uz pomoć jednog sustava orkestracije, u prosjeku 50 puta dnevno predaje kod, a najjači dan je predala 94 puta, dok je primila 3 poziva od klijenata, a editor nikada nije otvorila.

Zar to nije kao da jedna osoba radi posao cijelog razvojnog tima?

Danas ću analizirati kako je to postigao.

OpenClaw nije nepoznat

Ovaj mali rak je od Kineske Nove Godine do sada bio vrlo popularan. Ukratko, to je open-source AI Agent okvir, koji je na GitHubu trenutno prešao 240.000 zvjezdica, a prije nekoliko dana je službeno prešao React, postavši open-source projekt s najbržim rastom zvjezdica u povijesti GitHuba.

Osnivač Peter Steinberger je austrijski programer, ranije je osnovao PSPDFKit (B2B tvrtku za PDF okvir), a 2021. godine je dobio investiciju od 100 milijuna eura od Insight Partners. U veljači ove godine Peter je najavio pridruživanje OpenAI-u, a projekt OpenClaw je prebačen u upravljanje open-source zaklade.

OpenClaw nije chatbot, već AI Agent runtime koji radi na vašem lokalnom uređaju. Ima četiri ključne komponente: Gateway (ulazna točka, povezuje više od 50 platformi za poruke), Agent (motor za inferenciju), Skills (više od 5400 dodataka), Memory (sustav pamćenja).

Međutim, Elvis koristi OpenClaw na prilično poseban način. On ga izravno koristi kao sloj orkestracije, posebno za upravljanje kodirajućim agentima kao što su Claude Code i Codex, a ne kao općeg asistenta.

Ova ideja je zaista neobična.

Zašto je potreban sloj orkestracije?

Elvis je u tweetu istaknuo jedan ključni pojam: kontekstualni prozor je nulti igra.

Ako unutra stavite kod, nema prostora za poslovni kontekst. Ako stavite povijest klijenata i zapisnike sastanaka, nema prostora za repozitorij koda. Čak i najjači AI ne može istovremeno obraditi dva potpuno različita tipa informacija.

Zato je sustav podijelio u dva sloja.

Gornji sloj je orkestrator OpenClaw, Zoe, koja upravlja svim poslovnim kontekstom, uključujući podatke o klijentima, zapisnike sastanaka, povijesne odluke, koje su opcije isprobane, a koje su propale. Sve te informacije nalaze se u Elvisovoj Obsidian bilježnici, a Zoe ih može izravno čitati.

Donji sloj su kodirajući agenti kao što su Claude Code i Codex, koji se fokusiraju isključivo na kod i pisanje koda. Kada se svaki agent pokrene, Zoe će mu na temelju poslovnog konteksta napisati precizan prompt, govoreći mu što treba raditi, koja je pozadina i što klijent želi.

Ukratko: orkestrator je odgovoran za razumijevanje zahtjeva, a kodirajući agenti su odgovorni za rad. Svaki radi ono što najbolje zna.

Ova arhitektura je slična internom sustavu Minions koji je Stripe nedavno objavio. Stripeovi Minions također su dizajn s paralelnim kodirajućim agentima i centraliziranim slojem orkestracije, koji tjedno mogu spojiti više od 1000 PR-ova koje je u potpunosti napisao AI. Elvis kaže da je slučajno izgradio sličnu arhitekturu, samo što radi na njegovom Mac mini.

Stvarni primjer radnog toka

Elvis je u tweetu koristio stvarni primjer kako bi objasnio svoj cjelokupni radni tok, a ja ću jednostavno povezati ključne dijelove.On je primio poziv od klijenta koji je želio ponovno iskoristiti postojeće konfiguracije unutar tima. Nakon razgovora, razgovarao je sa Zoe o toj potrebi. Budući da se svi zapisnici sastanaka automatski sinkroniziraju s Obsidianom, Zoe je već znala što je klijent rekao, nije bilo potrebno da Elvis dodatno objašnjava. Zajedno su odredili opseg funkcionalnosti, a konačno rješenje je bilo izraditi sustav predložaka.

Zoe je zatim automatski napravila tri stvari: naplatila klijentu uslugu otključavanja (ima administratorske API privilegije), povukla postojeće konfiguracije klijenta iz produkcijske baze podataka (samo za čitanje, kodni Agent nikada neće imati te privilegije), a zatim generirala Codex Agenta s detaljnim promptom koji sadrži cjelokupni poslovni kontekst.

Svaki Agent ima svoju neovisnu radnu granu (izolirana grana) i tmux sesiju. Komanda za pokretanje izgleda otprilike ovako:

# Kreiraj radnu granu + pokreni agenta git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high Nakon što Agent pokrene, postoji zadatak koji provjerava stanje svakih 10 minuta. No, on neće izravno pitati Agenta (to bi previše trošilo tokene), već će pokrenuti deterministički Shell skript koji provjerava je li tmux sesija još uvijek aktivna, je li PR stvoren, i je li CI prošao.

Ako CI ne uspije, automatski ponovno pokreće Agenta, najviše 3 puta. Obavijest se šalje samo kada je potrebna ljudska intervencija.

Nakon što Agent završi zadatak, automatski će stvoriti PR. No, samo stvaranje PR-a nije kraj, Elvis je definirao skup standarda za završetak: PR stvoren, grana sinkronizirana s main (bez sukoba pri spajanju), CI prošao, kodna revizija tri AI modela prošla, a ako ima promjena u UI-u, mora biti priložena slika zaslona.

Tri AI modela za reviziju koda

Tri AI modela za reviziju koda izgledaju vrlo pouzdano. Razgovarajući o njegovim ocjenama ovih triju modela, prilično je zanimljivo.

Codex Reviewer, on ga ocjenjuje najvišim, kaže da je revizija u slučaju rubnih situacija i logičkih grešaka vrlo temeljita, a stopa lažnih pozitivnih rezultata je vrlo niska.

Gemini Code Assist Reviewer, besplatan, kaže da je vrlo koristan, može otkriti sigurnosne rizike i probleme s skalabilnošću koje su drugi modeli propustili, a također može dati konkretne prijedloge za ispravke.

Claude Code Reviewer, njegove riječi su "praktički beskoristan", kaže da je previše oprezan, pun je prijedloga poput "razmotrite dodavanje...", većina pripada prekomjernom dizajnu. Osim ako nije označeno kao ključni problem, on to jednostavno preskoči.

Kad sam pročitao ovaj dio, bio sam pomalo iznenađen. Kao težak korisnik Claude Code-a, također sam naišao na situacije kada je bio previše konzervativan tijekom revizije koda, ali ocjena "praktički beskoristan" je ipak malo previše. No, to također s jedne strane pokazuje da je međusobna revizija s više modela zaista vrijedna, pristranosti različitih modela se savršeno nadopunjuju.

Tek nakon što su svi revizori prošli, Elvis će primiti obavijest na Telegramu. Do ovog koraka, uglavnom gleda slike zaslona, potvrđuje jesu li promjene u UI-u ispravne, mnoge PR-ove spaja bez gledanja koda. Kaže da mu je potrebna samo 5 do 10 minuta za ručnu reviziju.

Zoeina proaktivnost

Zoe nije samo izvršitelj. Ono što je zanimljivije od samog radnog toka je Zoeina proaktivnost.

Elvis kaže da Zoe ne čeka da joj dodijeli zadatak, već aktivno traži posao. Ujutro skenira Sentry-ove logove grešaka, otkriva 4 nova problema, automatski generira 4 Agenta za ispravak. Nakon sastanka skenira zapisnike sastanka, označava 3 funkcionalne potrebe koje je klijent spomenuo, a zatim automatski pokreće 3 Codex Agenta. Navečer skenira Git logove, pokreće Claude Code za ažuriranje changeloga i dokumentacije za klijente.

Elvis se vrati s kratke šetnje, a na Telegramu ga čeka poruka: 7 PR-ova je spremno, 3 nove funkcionalnosti, 4 ispravke grešaka. Zar to nije učinak koji sam oduvijek želio postići s OPC jednim čovjekom razvojnim timom?A kada Agent ne uspije, Zoein način rješavanja problema je mnogo napredniji od jednostavnog ponovnog pokušaja. Ona će analizirati uzrok neuspjeha u kontekstu poslovanja. Je li kontekst Agenta preopterećen? Sužava opseg i omogućava Agentu da se fokusira samo na tri datoteke. Je li Agent skrenuo s puta? Također će ispraviti, reći Agentu da klijent traži X, a ne Y, i priložiti izvorne riječi iz sastanka.

S vremenom, Zoe će akumulirati iskustvo, zapamtiti koje strukture prompta daju dobre rezultate za koje vrste zadataka, i sljedeći put napisati precizniji prompt.

Ova ideja je zapravo nadogradnja Ralph Loop-a. Osnovna logika Ralph Loop-a je ciklus povlačenja konteksta, generiranja izlaza, procjene rezultata i spremanja iskustva, ali većina implementacija ima fiksni prompt za svaki ciklus. Elvisov sustav je drugačiji; svaki put kada ponovo pokušava, Zoe dinamički prilagođava prompt na temelju uzroka neuspjeha, a uz to ima i potpuni poslovni kontekst.

Troškovi i hardver

Što se tiče troškova, Elvisovi javni podaci govore da Claude košta oko 100 dolara mjesečno, a Codex oko 90 dolara mjesečno. Također je rekao da se može početi s ispitivanjem od 20 dolara.

Ovi troškovi su naravno smiješno niski u usporedbi s zapošljavanjem jednog programera. No, ako uzmete u obzir da također trebate donijeti odluke o proizvodu, komunicirati s klijentima i pregledavati kod, to više izgleda kao pojačivač učinkovitosti, pomažući vam da izbjegnete najponavljajuće dijelove kao što su kodiranje i testiranje.

Što se tiče hardvera, Elvis je spomenuo da mu je trenutno najveća prepreka RAM. Svakom Agentu je potrebno neovisno radno okruženje, svako radno okruženje ima svoje nodemodules, svaki Agent mora pokrenuti izgradnju, provjeru tipova i testiranje. 5 Agenta koji rade istovremeno znači 5 paralelnih TypeScript kompajlera, 5 testnih pokretača, 5 setova ovisnosti.

Njegov Mac mini s 16GB RAM-a može istovremeno pokrenuti najviše 4 do 5 Agenta, a više od toga počinje s razmjenom memorije. Zato je kupio Mac Studio M4 Max s 128GB RAM-a (3500 dolara), planirajući ga koristiti za podršku većem broju paralelnih Agenta.

Sažetak i stvarni problemi

Iskreno, Elvisov sustav me prilično impresionirao. Prije sam OpenClaw smatrao igračkom, a za povećanje produktivnosti oslanjao sam se na neovisni Claude Code. Povremeno sam koristio radno okruženje za paralelno, ali daleko od ovog sistematiziranog pristupa. Nakon što sam pročitao njegove objave, osjećam da je plafon AI programiranja ponovno podignut.

Nedavno se pripremam slijediti njegovu ideju i koristiti OpenClaw za izgradnju potpuno automatiziranog jednog razvojnog tima. Stoga ćemo u bliskoj budućnosti objaviti više članaka o praksi OpenClaw-a.

Postoji nekoliko stvarnih problema koje treba napomenuti.

Ovaj sustav pretpostavlja da imate jasan proizvod, jasne potrebe klijenata i razvijen CI/CD proces. Elvis radi na stvarnom B2B SaaS proizvodu, ima klijente, prihod i proizvodno okruženje. Ako još uvijek radite na demonstracijama ili ste u fazi učenja, ROI ovog okvira možda neće biti isplativ.

Osim toga, trenutni sigurnosni problemi OpenClaw-a također su važni. Prema javnim informacijama, već je otkriveno nekoliko visokorizičnih CVE-a, a pronađeno je i 341 zlonamjenski dodatak zajednice koji ima ponašanje krađe podataka. Kada implementirate OpenClaw, izolacija i kontrola pristupa moraju biti dobro postavljene. To je također razlog zašto ga nisam implementirao na svom glavnom lokalnom stroju.

Još jedna stvar, Elvis je u objavama dao nisku ocjenu za pregled koda Claude Code-a, ali nedavno je Claude Code upravo predstavio funkciju Agent Teams (ugrađena suradnja više Agenta), a Anthropic također radi na ovom smjeru.

No, ostavljajući po strani ove detalje, Elvisova arhitektura sloja orkestracije i sloja izvršenja zaista zaslužuje pažnju. Zero-sum igra kontekstualnog prozora je stvarna ograničenja, a korištenje slojevite arhitekture za rješavanje ovog problema, omogućujući različitim AI-ima da obavljaju svoje zadatke, mislim da je pravi smjer.[[HTMLPLACEHOLDER0]][[HTMLPLACEHOLDER_1]]