OpenClaw + Claude Code/Codex:Ustvarjanje osebnega razvojnega Agent Swarm
OpenClaw + Claude Code/Codex:Ustvarjanje osebnega razvojnega Agent Swarm
Pozdravljeni, jaz sem Lu Gong.
Pred kratkim sem na X naletel na objavo, ki me je takoj pritegnila. Neodvisni razvijalec po imenu Elvis je povedal, da zdaj ne uporablja več neposredno Claude Code in Codex, ampak uporablja OpenClaw kot plast za orkestracijo, da upravlja celotno skupino agentov Claude Code in Codex, ki jih imenuje Zoe.
Podatki te objave so prav tako impresivni, 4,9 milijona ogledov, 11.000 všečkov, 1800 delitev.
Naš račun Vibe Coding obstaja že več kot štiri mesece, Claude Code pa je bil vedno glavno orodje. Pred tem sem napisal tudi nekaj člankov o sodelovanju več agentov, arhitekturi več agentov v VSCode in podobno.
Toda ko sem videl Elvisovo metodo, sem lahko le rekel, da je res strokovnjak. Ena oseba, s sistemom orkestracije, povprečno 50 oddaj kode na dan, na najboljši dan pa je oddal 94, hkrati pa je prejel tri telefonske klice strank in niti enkrat odprl urejevalnik.
Ali to ni kot da ena oseba deluje kot celotna razvojna ekipa?
Danes bomo razčlenili, kako mu je to uspelo.
OpenClaw ni neznanka
Ta mali rak je pred prazniki še vedno zelo priljubljen. Preprosto povedano, gre za odprtokodni okvir AI agentov, ki ima na GitHubu že več kot 240.000 zvezdic in je pred dvema dnevoma uradno prehitel React ter postal najhitreje rastoč projekt odprte kode v zgodovini GitHub-a.
Ustanovitelj Peter Steinberger je avstrijski razvijalec, ki je prej ustanovil PSPDFKit (B2B podjetje za PDF okvir). Leta 2021 je prejel 100 milijonov evrov naložbe od Insight Partners. Februarja letos je Peter napovedal, da se pridružuje OpenAI, projekt OpenClaw pa je bil predan fundaciji za odprto kodo.
OpenClaw ni zasnovan kot klepetalni robot, ampak kot AI agent, ki deluje na vašem lokalnem napravi. Ima štiri ključne komponente: Gateway (vrata, ki povezujejo več kot 50 platform za sporočanje), Agent (motor za sklepanje), Skills (več kot 5400 vtičnikov), Memory (sistem spomina).
Toda Elvis uporablja OpenClaw na poseben način. Uporablja ga kot plast orkestracije, namenjeno upravljanju kodirnih agentov Claude Code in Codex, ne kot splošnega asistenta.
Ta ideja je resnično izjemna.
Zakaj potrebujemo plast orkestracije?
Elvis je v objavi izpostavil zelo ključno točko: okno konteksta je igra z ničelnim vsoto.
Če vanj vstavite kodo, ni prostora za poslovni kontekst. Če vanj vstavite zgodovino strank in zapisnike sestankov, ni prostora za knjižnico kode. En sam AI, kako močan koli, ne more hkrati obravnavati dveh popolnoma različnih vrst informacij.
Zato je sistem razdelil na dve plasti.
Zgornja plast je orkestrator OpenClaw, Zoe, ki obvladuje vse poslovne kontekste, vključno s podatki strank, zapisniki sestankov, zgodovinskimi odločitvami, katera rešitev je bila preizkušena in katera je propadla. Vse te informacije so shranjene v Elvisovem Obsidian beležnem sistemu, Zoe pa jih lahko neposredno bere.
Spodnja plast so kodirni agenti Claude Code in Codex, ki gledajo samo kodo in se ukvarjajo samo s pisanjem kode. Vsak agent se ob zagonu sproži, Zoe pa mu na podlagi poslovnega konteksta napiše natančen poziv, ki mu pove, kaj naj stori, kakšna je ozadje in kaj stranka želi.
Preprosto povedano: orkestrator je odgovoren za razumevanje potreb, kodirni agenti pa za delo. Vsak dela tisto, kar najbolje obvlada.
Ta arhitektura je podobna notranjemu sistemu Minions, ki ga je Stripe nedavno razkril. Stripe Minions je prav tako zasnova paralelnih kodirnih agentov z osredotočeno plastjo orkestracije, ki lahko na teden združi več kot 1000 PR-jev, ki jih je v celoti napisal AI. Elvis pravi, da je nenamerno zgradil podobno arhitekturo, le da deluje na njegovem Mac mini.
Resničen primer delovnega toka
Elvis je v objavi uporabil resničen primer, da predstavi svoj celoten delovni tok, jaz pa bom preprosto povzel ključne korake.On je prejel telefonski klic stranke, ki je želela ponovno uporabiti obstoječe nastavitve znotraj ekipe. Po končanem klicu je z Zoe spregovoril o tej potrebi. Ker se vsi zapisniki sestankov samodejno sinhronizirajo v Obsidian, je Zoe že vedela, kaj je stranka povedala, zato ni bilo potrebno, da bi ji Elvis dodatno razlagal. Skupaj sta določila obseg funkcionalnosti, končna rešitev pa je bila izdelava sistema predlog.Ko Agent ne uspe, je Zoejev način ravnanja veliko bolj napreden kot preprosto ponavljanje. Analizira vzroke neuspeha v kontekstu poslovanja. Je Agentov kontekst zrušen? Omeji obseg, da se Agent osredotoči le na tri datoteke. Je Agentova smer napačna? Tudi to bo popravila, in Agentu povedala, da stranka želi X, ne Y, ter priložila izvirne besede iz sestanka.
S časom Zoe tudi nabira izkušnje, zapomni si, katere strukture pozivov so učinkovite za katere vrste nalog, in naslednjič napiše bolj natančne pozive.
Ta ideja je pravzaprav nadgradnja Ralphove zanke. Osnovna logika Ralphove zanke je ciklus, ki vključuje pridobivanje konteksta, generiranje izhodov, ocenjevanje rezultatov in shranjevanje izkušenj, vendar je večina implementacij fiksnih pozivov za vsak cikel. Elvisov sistem je drugačen, pri vsakem ponovnem poskusu Zoe dinamično prilagodi poziv glede na vzrok neuspeha, poleg tega pa ima popoln poslovni kontekst.
Stroški in strojna oprema
Glede stroškov, Elvisovi javni podatki kažejo, da Claude stane približno 100 dolarjev na mesec, Codex pa približno 90 dolarjev na mesec. Povedal je tudi, da lahko začneš s poskusom za 20 dolarjev.
Ti stroški so seveda smešno nizki v primerjavi z zaposlitvijo razvijalca. Ampak če upoštevamo, da moraš še vedno sprejemati odločitve o izdelku, komunicirati s strankami in pregledovati kodo, je to bolj kot ojačevalnik učinkovitosti, ki ti prihrani kodiranje in testiranje, kar sta najbolj ponavljajoča se dela.
Glede strojne opreme, Elvis omenja, da je njegov največji omejitveni dejavnik RAM. Vsak Agent potrebuje neodvisno delovno drevo, vsako delovno drevo ima svoje nodemodules, vsak Agent mora izvajati gradnjo, preverjanje tipov in testiranje. 5 Agentov, ki delujejo hkrati, pomeni 5 vzporednih TypeScript prevajalnikov, 5 testnih izvajalnikov in 5 kompletov odvisnosti.
Njegov Mac mini z 16 GB RAM-a lahko hkrati poganja največ 4 do 5 Agentov, več pa začne zamenjati pomnilnik. Zato je kupil Mac Studio M4 Max z 128 GB RAM-a (3500 dolarjev), da bi lahko obvladal večjo sočasnost Agentov.
Povzetek in realni problemi
Iskreno, Elvisov sistem me je precej presenetil. Prej sem OpenClaw obravnaval kot igračo, pri povečanju produktivnosti pa sem se zanašal na neodvisni Claude Code. Občasno sem uporabljal delovno drevo za vzporedno delo, vendar nikoli ne na tako sistematičen način. Po pregledu njegovih objav sem začutil, da je meja AI programiranja spet dvignjena.
Zadnje čase delam po njegovih zamislih in nameravam z OpenClaw ustvariti popolnoma avtomatizirano enopersonsko razvojno ekipo. Tako da bomo kmalu objavili več člankov o praksi OpenClaw.
Obstaja nekaj realnih težav, na katere vas moram opozoriti.
Ta sistem predpostavlja, da imate jasno opredeljen izdelek, jasne potrebe strank in dobro razvito CI/CD linijo. Elvis dela na resničnem B2B SaaS produktu, ima stranke, prihodke in proizvodno okolje. Če še vedno pišete demo ali ste v fazi učenja, morda ta arhitektura ne bo imela dobrega ROI.
Poleg tega je treba opozoriti tudi na trenutne varnostne težave OpenClaw. Glede na javne informacije je bilo razkritih več visokorizičnih CVE, prav tako pa je bilo odkritih 341 zlonamernih skupnostnih vtičnikov, ki so izvajali krajo podatkov. Pri nameščanju OpenClaw je treba dobro poskrbeti za izolacijo in nadzor dostopa. To je tudi razlog, zakaj OpenClaw še nisem namestil na svoj glavni lokalni računalnik.
Še ena stvar, Elvis je v objavi podcenil oceno pregleda kode Claude Code, vendar je Claude Code nedavno predstavil funkcijo Agent Teams (uradno vgrajeno sodelovanje več Agentov), Anthropic pa se tudi usmerja v to smer.
Kljub tem podrobnostim pa je Elvisova ideja o arhitekturi s plastmi za usklajevanje in izvajanje res vredna pozornosti. Zelo realna omejitev je natančno usklajevanje kontekstualnih okvirov, uporaba plastične arhitekture za reševanje tega problema in omogočanje različnim AI, da opravljajo svoje naloge, se mi zdi prava smer.[[HTMLPLACEHOLDER0]][[HTMLPLACEHOLDER_1]]

