OpenClaw + Claude Code/Codex：kurti asmeninę kūrimo agentų grupę

Sveiki visi, aš esu Lu Gong.

Neseniai X platformoje pamačiau įrašą, kuris iš karto patraukė mano dėmesį. Nepriklausomas kūrėjas, vardu Elvis, sakė, kad dabar jis tiesiogiai nenaudoja Claude Code ir Codex, o vietoj to naudoja OpenClaw kaip sudėtingumo sluoksnį, leidžiant AI koordinatoriai, vardu Zoe, valdyti visą Claude Code ir Codex agentų grupę.

Šis įrašas taip pat turėjo įspūdingus duomenis: 4,9 mln. peržiūrų, 11 tūkst. patiktukų, 1800 pasidalinimų.

Mes rašome Vibe Coding jau daugiau nei keturis mėnesius, Claude Code visada buvo pagrindinis įrankis. Anksčiau taip pat rašiau apie daugelio agentų bendradarbiavimą, VSCode daugelio agentų architektūrą ir panašius straipsnius.

Bet pamačius Elvio šį metodą, negalėjau nesakyti, kad jis tikrai profesionalas. Vienas žmogus, naudodamas vieną sudėtingumo sistemą, vidutiniškai kasdien pateikia 50 kodų, o vieną dieną net 94 kartus, dar gavo 3 klientų skambučius, o redaktoriaus net neatsidarė.

Ar tai ne tas pats, kas vienam žmogui būti visai kūrimo komandai?

Šiandien šiame straipsnyje išnagrinėsime, kaip jis tai padarė.

OpenClaw visiems žinomas

Šis mažas vėžys nuo Naujųjų metų iki dabar buvo labai populiarus. Paprastai tariant, tai yra atviro kodo AI agentų sistema, kuri GitHub jau turi daugiau nei 240 tūkst. žvaigždučių ir prieš kelias dienas oficialiai aplenkė React, tapdama greičiausiai augančiu atviro kodo projektu GitHub istorijoje.

Įkūrėjas Peter Steinberger yra Austrijos kūrėjas, anksčiau įkūręs PSPDFKit (PDF sistemos B2B įmonę), 2021 m. gavo 100 mln. eurų investiciją iš Insight Partners. Šių metų vasarį Peter paskelbė, kad prisijungia prie OpenAI, o OpenClaw projektas buvo perduotas atviro kodo fondui.

OpenClaw nėra pokalbių robotas, tai AI agentų vykdymo sistema, veikianti jūsų vietiniame įrenginyje. Ji turi keturis pagrindinius komponentus: Gateway (vartai, jungiantys daugiau nei 50 pranešimų platformų), Agent (intelekto variklis), Skills (daugiau nei 5400 papildinių), Memory (atminties sistema).

Tačiau Elvio naudojimas OpenClaw yra gana ypatingas. Jis tiesiog naudoja jį kaip sudėtingumo sluoksnį, skirtą valdyti Claude Code ir Codex kodavimo agentus, nesinaudodamas juo kaip universaliu asistentu.

Ši mintis tikrai yra nepaprasta.

Kodėl reikia sudėtingumo sluoksnio?

Elvis savo įraše paminėjo labai svarbų punktą: konteksto langas yra nulinis žaidimas.

Jei į jį įdėsite kodą, nebeliks vietos verslo kontekstui. Jei įdėsite klientų istoriją ir susitikimų protokolus, nebeliks vietos kodų bazei. Net ir pats galingiausias AI negali vienu metu talpinti dviejų visiškai skirtingų tipų informacijos.

Todėl jis sistemą padalijo į dvi dalis.

Viršutinė dalis yra OpenClaw koordinatorius Zoe, kuri valdo visą verslo kontekstą, įskaitant klientų duomenis, susitikimų protokolus, istorinius sprendimus, kokie sprendimai buvo išbandyti, kurie nepavyko. Visa ši informacija yra Elvio Obsidian užrašų bibliotekoje, o Zoe gali ją tiesiogiai perskaityti.

Apatinė dalis yra Claude Code ir Codex kodavimo agentai, kurie žiūri tik į kodą ir rūpinasi tik kodavimu. Kiekvienam agentui paleidžiant, Zoe pagal verslo kontekstą parašo jam tikslią užklausą, nurodydama, ką daryti, koks yra kontekstas, ko nori klientas.

Paprasčiau tariant: koordinatorius atsakingas už poreikių supratimą, kodavimo agentai atsakingi už darbą. Kiekvienas daro tai, ką geriausiai moka.

Ši architektūra yra panaši į Stripe neseniai paskelbtą vidinę sistemą Minions. Stripe Minions taip pat yra lygiagrečių kodavimo agentų ir centralizuoto sudėtingumo sluoksnio dizainas, galintis sujungti daugiau nei 1000 PR, visiškai sukurtų AI, per savaitę. Elvis sakė, kad jis netyčia sukūrė panašią architektūrą, tik ji veikia jo Mac mini.

Tikras atvejo darbo srautas

Elvis savo įraše pateikė tikrą atvejį, kad paaiškintų savo visą darbo srautą, aš trumpai apžvelgsiu pagrindinius etapus.Jis priėmė kliento skambutį, klientas norėjo pakartotinai naudoti esamus nustatymus komandoje. Skambutis baigėsi, jis pasikalbėjo su Zoe apie šį poreikį. Kadangi visi susitikimų protokolai automatiškai sinchronizuojami su Obsidian, Zoe jau žinojo, ką klientas pasakė, todėl Elvisui nereikėjo papildomai aiškinti. Jie kartu nustatė funkcionalumo ribas, o galutinis sprendimas buvo sukurti šablonų sistemą.

Tada Zoe automatiškai atliko tris veiksmus: papildė kliento paslaugas (ji turi administratoriaus API teises), iš gamybos duomenų bazės gavo kliento esamus nustatymus (tik skaitymo teisės, kodavimo Agentas niekada neturės šių teisių), tada sukūrė Codex Agentą, turintį išsamų promptą su visais verslo konteksto duomenimis.

Kiekvienas Agentas turi savo nepriklausomą worktree (izoliuotą šaką) ir tmux sesiją. Paleidimo komanda maždaug atrodo taip:

# Sukurti worktree + paleisti agentą git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high Agentas pradėjus veikti, yra suplanuotas užduotis kas 10 minučių patikrinti. Tačiau jis tiesiogiai neklausia Agentų (nes tai per daug sunaudoja tokenus), o vykdo deterministinį Shell skriptą, kuris tikrina, ar tmux sesija vis dar gyva, ar buvo sukurta PR, ar CI praėjo.

Jei CI nepavyko, Agentas automatiškai perkraunamas, maksimaliai bandant 3 kartus. Pranešimai siunčiami tik tada, kai reikia žmogaus įsikišimo.

Agentas užbaigus užduotį automatiškai sukuria PR. Tačiau vien PR sukūrimas dar nereiškia, kad viskas baigta, Elvis apibrėžė užbaigimo standartą: PR sukūrimas, šakos sinchronizavimas su main (be sujungimo konfliktų), visi CI praėjo, trijų AI modelių kodo peržiūra visiškai praėjo, jei yra UI pakeitimų, taip pat privaloma pridėti ekrano nuotrauką.

Trys AI modeliai atlieka kodo peržiūrą

Trys AI modeliai atlieka kodo peržiūrą atrodo labai stabiliai. Pasikalbėkime apie jo vertinimą šiems trims modeliams, tai gana įdomu.

Codex Reviewer, jis vertina aukščiausiai, sako, kad jo peržiūra yra labai išsami ribinėse situacijose ir logikos klaidų atžvilgiu, klaidų rodiklis labai žemas.

Gemini Code Assist Reviewer, nemokamas, jis sako, kad labai naudingas, gali rasti kitų modelių praleistas saugumo problemas ir plėtros klausimus, taip pat gali pateikti konkrečius taisymo pasiūlymus.

Claude Code Reviewer, jo žodžiais tariant, "beveik nenaudingas", sako, kad jis per daug atsargus, pilna pasiūlymų "apsvarstyti pridėti..." ir panašiai, dauguma jų priklauso per dideliam projektavimui. Išskyrus tuos, kurie pažymėti kaip kritiniai klausimai, jis tiesiog praleidžia.

Kai pamačiau šią dalį, buvau šiek tiek nustebintas. Kaip Claude Code intensyvus vartotojas, aš tikrai susidūriau su jo per dideliu atsargumu atliekant kodo peržiūrą, tačiau sakyti, kad jis beveik nenaudingas, yra šiek tiek per daug. Tačiau tai taip pat iš dalies rodo, kad daugelio modelių kryžminė peržiūra tikrai turi vertę, skirtingų modelių šališkumas puikiai papildo vienas kitą.

Po to, kai visi trys peržiūros praėjo, Elvis gauna Telegram pranešimą. Šiuo etapu jis daugiausia žiūri į ekrano nuotraukas, kad patvirtintų, ar UI pakeitimai yra teisingi, daugelį PR jis neskatydamas kodo tiesiog sujungia. Jis sako, kad jo rankinė peržiūra užtrunka tik 5–10 minučių.

Zoe iniciatyva

Zoe nėra tik vykdytoja. Įdomiau nei pats darbo srautas yra Zoe iniciatyva.

Elvis sako, kad Zoe nesėdi ir laukia, kol jai bus paskirta užduotis, ji aktyviai ieško darbo. Ryte ji peržiūri Sentry klaidų žurnalus, randa 4 naujas klaidas, automatiškai sukuria 4 Agentus, kad jas ištaisytų. Po susitikimo ji peržiūri susitikimų protokolus, pažymi 3 funkcijų reikalavimus, kuriuos paminėjo klientas, tada automatiškai paleidžia 3 Codex Agentus. Vakare ji peržiūri Git žurnalus, paleidžia Claude Code, kad atnaujintų changelog ir kliento dokumentus.

Elvis išeina pasivaikščioti ir grįžęs randa Telegram žinutę: 7 PR paruošti, 3 naujos funkcijos, 4 klaidų taisymai. Ar tai ne tas OPC vieno žmogaus įmonės kūrimo komandos efektas, kurio aš visada tikėjausi?Be to, kai Agentas nepavyksta, Zoe tvarkymo būdas yra daug pažangesnis nei paprastas bandymas dar kartą. Ji analizuoja nesėkmės priežastis, atsižvelgdama į verslo kontekstą. Ar Agentas prarado kontekstą? Ji apriboja sritį, leidžiant Agentui sutelkti dėmesį tik į tris failus. Ar Agentas nukrypo nuo tikslo? Ji taip pat tai ištaiso, pasakydama Agentui, kad klientas nori X, o ne Y, ir pridėdama originalius žodžius iš susitikimo.

Laikui bėgant, Zoe taip pat kaupia patirtį, prisimindama, kurie prompt struktūros gerai veikia kuriant tam tikras užduotis, kad kitą kartą galėtų parašyti tikslesnį prompt.

Ši mintis iš tikrųjų yra Ralph Loop atnaujinta versija. Ralph Loop pagrindinė logika yra konteksto traukimas, išvesties generavimas, rezultatų vertinimas ir patirties kaupimas, tačiau dauguma įgyvendinimų kiekvieno ciklo prompt yra fiksuoti. Elvis sistema yra kitokia, kiekvieną kartą bandydama Zoe dinamiškai pritaiko prompt pagal nesėkmės priežastis, be to, turi pilną verslo kontekstą.

Išlaidos ir aparatinė įranga

Kalbant apie išlaidas, Elvis viešai pateikti duomenys rodo, kad Claude kainuoja apie 100 dolerių per mėnesį, o Codex - apie 90 dolerių per mėnesį. Jis taip pat sakė, kad galima pradėti nuo 20 dolerių, kad išbandytumėte.

Šios išlaidos, palyginti su programuotojo samdymu, yra akivaizdžiai mažesnės. Tačiau jei atsižvelgsime į tai, kad jums taip pat reikia priimti produktų sprendimus, bendrauti su klientais ir atlikti kodo peržiūras, tai labiau primena efektyvumo didintuvą, padedantį sutaupyti laiko kodavimui ir testavimui, kurie yra labiausiai pasikartojantys etapai.

Kalbant apie aparatinę įrangą, Elvis paminėjo, kad jo didžiausias apribojimas šiuo metu yra RAM. Kiekvienam Agentui reikia nepriklausomo worktree, kiekvienas worktree turi savo node_modules, kiekvienas Agentas turi vykdyti statybą, tipų tikrinimą ir testavimą. 5 Agentai, veikiantys vienu metu, reiškia 5 lygiagrečius TypeScript kompiliatorius, 5 testų vykdytojus ir 5 priklausomybes.

Jo Mac mini su 16GB RAM gali vienu metu paleisti 4-5 Agentus, daugiau jau pradeda keisti atmintį. Taigi jis nusipirko 128GB RAM Mac Studio M4 Max (3500 dolerių), planuodamas jį naudoti daugiau Agentų vienu metu.

Santrauka ir realios problemos

Nuoširdžiai kalbant, Elvis sistema man padarė didelį įspūdį. Anksčiau aš visada laikiau OpenClaw žaislu, o kuriant produktyvumą, aš remiausi nepriklausomu Claude Code. Kartais naudoju worktree paraleliai, bet toli gražu ne iki tokio sistemingo organizavimo lygio. Perskaičius jo tweet'us, manau, kad AI programavimo galimybės vėl pakilo.

Pastaruoju metu aš pagal jo mintis ruošiuosi naudoti OpenClaw, kad sukurtume visiškai automatizuotą vieno kūrėjo komandą. Taigi, artimiausiu metu mūsų paskyroje bus paskelbta keletas OpenClaw praktinių straipsnių.

Yra keletas realių problemų, apie kurias reikia įspėti.

Ši sistema reikalauja, kad turėtumėte aiškų produktą, aiškius klientų poreikius ir gerai veikiančią CI/CD liniją. Elvis kuria tikrą B2B SaaS produktą, turi klientų, pajamų ir gamybos aplinką. Jei dar rašote demonstracijas arba esate mokymosi etape, šios architektūros ROI gali būti nepelninga.

Be to, šiuo metu OpenClaw saugumo problemos taip pat turi būti atidžiai stebimos. Remiantis viešai pateikta informacija, jau buvo atskleista keletas aukštos rizikos CVE, taip pat buvo atrasta 341 piktybinių bendruomenės papildinių, turinčių duomenų vagystės veiklą. Diegiant OpenClaw, būtina gerai pasirūpinti izoliacija ir teisių valdymu. Tai taip pat yra priežastis, kodėl aš vis dar nesu diegęs OpenClaw savo pagrindiniame kompiuteryje.

Dar viena pastaba, Elvis savo tweet'e neigiamai įvertino Claude Code kodo peržiūrą, tačiau neseniai Claude Code pristatė Agent Teams funkciją (oficialiai integruota daugelio Agentų bendradarbiavimas), o Anthropic taip pat dirba šia kryptimi.

Tačiau palikus šiuos smulkmenas, Elvis architektūros mintis, apimanti organizavimo ir vykdymo lygmenis, tikrai verta dėmesio. Konteksto lango nulinės sumos žaidimas iš tikrųjų yra egzistuojanti riba, o šią problemą sprendžiant su sluoksnių architektūra, leidžiant skirtingiems AI atlikti savo užduotis, manau, kad tai yra teisinga kryptis....