OpenClaw + Claude Code/Codex: Luodaan henkilökohtainen kehittäjä Agent Swarm

Hei kaikki, olen Lu Gong.

Äskettäin näin X:ssä twiitin, joka heti herätti huomioni. Itsensä Elvis-nimisenä esittelevä itsenäinen kehittäjä kertoi, että hän ei enää käytä suoraan Claude Codea ja Codexia, vaan käyttää OpenClaw'ta orkestrointikerroksena, jonka avulla Zoe-niminen AI-orkestroija hallitsee koko Claude Code- ja Codex-agenttien parvea.

Twiitin tiedot olivat myös vaikuttavia: 4,9 miljoonaa näyttökertaa, 11 000 tykkäystä, 1800 uudelleenlähetystä.

Olemme kirjoittaneet Vibe Codingista yli neljä kuukautta, ja Claude Code on ollut pääasiallinen työkalu. Olen aiemmin kirjoittanut joitakin artikkeleita monien agenttien yhteistyöstä, VSCode-monien agenttien arkkitehtuurista jne.

Mutta nähdessäni Elviksen tämän tavan, voin vain sanoa, että hän on asiantuntija. Yksi henkilö, yhden orkestrointijärjestelmän avulla, keskimäärin 50 koodin lähettämistä päivässä, intensiivisimpänä päivänä 94 kertaa, ja hän otti vastaan kolme asiakaspuhujaa, eikä avannut editoria kertaakaan.

Eikö tämä ole kuin yksi henkilö toimisi koko kehitystiiminä?

Tässä artikkelissa pureudumme siihen, miten hän todella onnistui tässä.

OpenClaw ei ole kenellekään vieras

Tämä pieni rapu on ollut suosittu vuodenvaihteen jälkeen. Yksinkertaisesti sanottuna se on avoimen lähdekoodin AI-agenttikehys, joka on saanut yli 240 000 tähteä GitHubissa ja ylitti äskettäin Reactin, ollen GitHubin historian nopeimmin kasvava avoimen lähdekoodin projekti.

Perustaja Peter Steinberger on Itävallan kehittäjä, joka on aiemmin perustanut PSPDFKitin (PDF-kehyksen B2B-yritys), ja hän sai Insight Partnersilta 100 miljoonan euron sijoituksen vuonna 2021. Tammikuussa Peter ilmoitti liittyvänsä OpenAI:hin, ja OpenClaw-projekti siirrettiin avoimen lähdekoodin säätiön hallintaan.

OpenClaw'n rooli ei ole chatbot, vaan se on AI-agentin ajonaika, joka toimii paikallisella laitteellasi. Siinä on neljä keskeistä komponenttia: Gateway (portti, joka yhdistää yli 50 viestintäalustaa), Agent (päättelymoottori), Skills (yli 5400 liitännäistä), Memory (muistijärjestelmä).

Mutta Elviksen tapa käyttää OpenClaw'ta on erityinen. Hän käyttää sitä suoraan orkestrointikerroksena, joka on erityisesti suunniteltu hallitsemaan Claude Codea ja Codexia, eikä hän käytä sitä yleisenä avustajana.

Tämä ajatus on todella poikkeuksellinen.

Miksi tarvitaan orkestrointikerros?

Elvis mainitsi twiitissään erittäin tärkeän näkökulman: kontekstin ikkuna on nollasummapeli.

Jos täytät sen koodilla, ei ole tilaa liiketoimintakontekstille. Jos täytät sen asiakashistorialla ja kokousmuistiinpanoilla, ei ole tilaa koodikirjastolle. Yksittäinen AI, kuinka vahva se onkaan, ei voi samanaikaisesti käsitellä kahta täysin erilaista tietotyyppiä.

Joten hän jakoi järjestelmän kahteen kerrokseen.

Yläkerros on OpenClaw'n orkestroija Zoe, joka hallitsee kaikkia liiketoimintakonteksteja, mukaan lukien asiakastiedot, kokousmuistiinpanot, historialliset päätökset, mitkä ratkaisut on kokeiltu, mitkä ovat epäonnistuneet. Nämä tiedot ovat kaikki Elviksen Obsidian-muistikirjassa, ja Zoe voi lukea ne suoraan.

Alakerros on Claude Code ja Codex -koodausagentit, jotka näkevät vain koodin ja huolehtivat vain koodin kirjoittamisesta. Kun kukin agentti käynnistetään, Zoe kirjoittaa liiketoimintakontekstin perusteella sille tarkan kehotteen, joka kertoo, mitä sen pitäisi tehdä, mikä on tausta ja mitä asiakas haluaa.

Yksinkertaisesti sanottuna: orkestroija vastaa vaatimusten ymmärtämisestä, koodausagentti vastaa työn tekemisestä. Kukin tekee sen, missä on paras.

Tämä rakenne on samankaltainen kuin Stripe, joka äskettäin julkaisi sisäisen järjestelmänsä Minions. Stripesin Minions on myös rinnakkainen koodausagentti ja keskitetty orkestrointikerros, joka pystyy yhdistämään yli 1000 täysin AI:n kirjoittamaa PR:ää viikossa. Elvis sanoi, että hän rakensi vahingossa samanlaisen rakenteen, mutta se toimii hänen omalla Mac mini -tietokoneellaan.

Todellinen tapaustyönkulku

Elvis käytti twiitissään todellista tapausta kertoakseen koko työnkulustaan, ja minä yhdistän keskeiset vaiheet yksinkertaisesti.Hän vastaanotti asiakaspuhelun, asiakas halusi käyttää olemassa olevia asetuksia tiiminsä sisällä. Puhelun jälkeen hän keskusteli Zoe'n kanssa tästä tarpeesta. Koska kaikki kokousmuistiot synkronoidaan automaattisesti Obsidianiin, Zoe tiesi jo, mitä asiakas oli sanonut, eikä Elvis tarvinnut selittää lisää. He määrittivät yhdessä toiminnallisuuden laajuuden, ja lopullinen ratkaisu oli luoda mallijärjestelmä.

Sitten Zoe teki automaattisesti kolme asiaa: lataa asiakkaille palvelun avaus (hänellä on järjestelmänvalvojan API-oikeudet), vetää asiakasta varten olemassa olevat asetukset tuotantotietokannasta (vain lukuoikeudet, koodausagentilla ei koskaan ole tätä oikeutta), ja luo sitten Codex Agent, joka sisältää täydellisen liiketoimintayhteyden yksityiskohtaisen kehotteen.

Jokaisella agentilla on oma eristetty työpuu (worktree) ja tmux-istunto. Käynnistyskomento on suurin piirtein seuraavanlainen:

# Luo työpuu + käynnistä agentti git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high"Agentti käynnistyy, ja sillä on aikarajattu tehtävä tarkistaa kerran kymmenessä minuutissa. Mutta se ei kysy suoraan agentilta (se olisi liian kallista tokenien suhteen), vaan se suorittaa deterministisen Shell-skriptin, joka tarkistaa, onko tmux-istunto edelleen aktiivinen, onko PR:tä luotu ja onko CI hyväksytty.

Jos CI epäonnistuu, agentti käynnistetään automaattisesti uudelleen, enintään kolme kertaa. Vain silloin, kun tarvitaan ihmisen väliintuloa, lähetetään ilmoitus.

Agentti luo automaattisesti PR:n tehtävänsä jälkeen. Mutta pelkkä PR:n luominen ei riitä, Elvis määritteli joukon valmiusstandardeja: PR:n luominen, haara synkronoituu päähaaraan (ilman yhdistämiskonflikteja), CI hyväksytään kokonaan, kolmen AI-mallin koodikatselmointi hyväksytään kokonaan, ja jos on UI-muutoksia, on liitettävä kuvakaappaus.

Kolme AI-mallia koodikatselmoinnissa

Kolme AI-mallia koodikatselmoinnissa näyttää olevan hyvin luotettavaa. Keskustellaan hänen arvioistaan näistä kolmesta mallista, se on melko mielenkiintoista.

Codex Reviewer, hän arvioi sen korkeimmalle, sanoen, että sen tarkastukset rajatapauksissa ja loogisissa virheissä ovat erittäin perusteellisia, ja väärien positiivisten ilmoitusten määrä on hyvin alhainen.

Gemini Code Assist Reviewer, ilmainen, hän sanoo olevan erittäin käytännöllinen, se voi löytää muita malleja, jotka ovat jättäneet huomiotta turvallisuusongelmia ja laajennettavuusongelmia, ja se voi antaa tarkkoja korjaussuunnitelmia.

Claude Code Reviewer, hänen sanansa ovat "perustasolla hyödyttömiä", hän sanoo sen olevan liian varovainen, täynnä ehdotuksia kuten "harkitse lisäämistä...", suurin osa kuuluu liialliseen suunnitteluun. Ellei sitä merkitä kriittiseksi ongelmaksi, hän ohittaa sen suoraan.

Kun näin tämän osan, olin hieman yllättynyt. Claude Code -käyttäjänä olen tosiaan kohdannut sen olevan liian varovainen koodikatselmoinnissa, mutta että se on käytännössä hyödyttömiä, on hieman liioiteltua. Tämä kuitenkin osoittaa, että useiden mallien ristiin tarkastaminen on todella arvokasta, eri mallien ennakkoluulot täydentävät toisiaan.

Kun kaikki kolme tarkastusta on hyväksytty, Elvis saa Telegram-ilmoituksen. Tässä vaiheessa hän katsoo pääasiassa kuvakaappauksia varmistaakseen, että UI-muutokset ovat oikein, monet PR:t hän yhdistää suoraan ilman koodin tarkastamista. Hän sanoo, että hänen manuaalinen tarkastuksensa vie vain 5-10 minuuttia.

Zoe'n aktiivisuus

Zoe ei ole vain toteuttaja. Kiinnostavampaa kuin työnkulku itsessään on Zoe'n aktiivisuus.

Elvis sanoo, että Zoe ei odota passiivisesti tehtävien jakamista, vaan hän etsii aktiivisesti työtä. Aamulla hän skannaa Sentryn virhelokit, löytää 4 uutta virhettä, ja luo automaattisesti 4 agenttia niiden korjaamiseksi. Kokouksen jälkeen hän skannaa kokousmuistiot, merkitsee asiakkaan mainitsemat 3 toiminnallisuustarvetta, ja käynnistää sitten automaattisesti 3 Codex Agentia. Illalla hän skannaa Git-lokit, käynnistää Claude Code -päivityksen changelogin ja asiakasi-dokumentin.

Kun Elvis palaa kävelyltä, Telegramissa on viesti: 7 PR:ää on valmiina, 3 uutta toimintoa, 4 bugikorjausta. Eikö tämä ole juuri se OPC-yksityisyrittäjän kehitystiimi, jota olen aina toivonut?Ja kun Agent epäonnistuu, Zoen käsittelytapa on paljon kehittyneempi kuin pelkkä uusi yritys. Se yhdistää liiketoimintayhteyden epäonnistumisen syiden analysoimiseen. Onko Agentin konteksti romahtanut? Se rajaa alueen, jotta Agent keskittyy vain kolmeen tiedostoon. Onko Agentin suunta väärä? Se myös korjaa sen, kertomalla Agentille, että asiakas haluaa X:n eikä Y:tä, ja liittää mukaan alkuperäiset sanat kokouksesta.

Ajan myötä Zoe myös kerää kokemusta, muistaa, mitkä prompt-rakenteet toimivat hyvin minkäkin tyyppisissä tehtävissä, ja kirjoittaa seuraavalla kerralla tarkempia promptteja.

Tämä ajatus on itse asiassa Ralph Loopin päivitetty versio. Ralph Loopin ydinlogiikka on kontekstin hakeminen, tuloksen tuottaminen, arviointi ja kokemuksen tallentaminen, mutta useimmissa toteutuksissa jokaisen silmukan prompt on kiinteä. Elvisin järjestelmä on erilainen; jokaisella uudella yrityksellä Zoe säätää promptia dynaamisesti epäonnistumisen syyn mukaan, ja sillä on täydellinen liiketoimintayhteys tukenaan.

Kustannukset ja laitteisto

Kustannusten osalta Elvisin julkiset tiedot ovat, että Claude maksaa noin 100 dollaria kuukaudessa ja Codex noin 90 dollaria kuukaudessa. Hän mainitsi myös, että aloitus voi olla 20 dollarista.

Tämä hinta on tietenkin naurettavan halpa verrattuna kehittäjän palkkaamiseen. Mutta jos otetaan huomioon, että sinun on myös tehtävä omat tuotevalintasi, asiakasviestintä ja koodin tarkastus, se on enemmän tehokkuuden suurentaja, joka auttaa sinua säästämään koodauksen ja testauksen toistuvimmista vaiheista.

Laitteiston osalta Elvis mainitsi, että hänen suurin pullonkaulansa tällä hetkellä on RAM. Jokaisella Agentilla on oltava oma worktree, ja jokaisella worktreellä on omat nodemodules, ja jokaisen Agentin on suoritettava rakennus, tyyppitarkistus ja testaus. Viisi Agenttia samanaikaisesti tarkoittaa viittä rinnakkaista TypeScript-kääntäjää, viittä testiajoa ja viittä riippuvuuspakettia.

Hänen Mac mini 16GB muistilla voi enintään ajaa 4-5 Agenttia samanaikaisesti, enemmän ja se alkaa käyttää muistinvaihtoa. Joten hän osti 128GB muistin Mac Studio M4 Maxin (3500 dollaria), aikomuksenaan käyttää sitä useamman Agentin samanaikaiseen käsittelyyn.

Yhteenveto ja käytännön ongelmat

Rehellisesti sanottuna, Elvisin tämä järjestelmä teki minuun melko suuren vaikutuksen. Olen aiemmin pitänyt OpenClawia leikkikaluina, ja tuottavuuden rakentamisessa olen luottanut itsenäiseen Claude Codeen. Käytän satunnaisesti worktreea rinnakkaisuuteen, mutta ei läheskään näin järjestelmällisellä tasolla. Kun luin hänen twiittejään, tunsin, että AI-ohjelmoinnin katto oli taas nostettu korkeammalle.

Olen viime aikoina suunnitellut hänen ajatustensa mukaan, että aion käyttää OpenClawia täysin automatisoidun yhden kehittäjän tiimin rakentamiseen. Joten tulevina aikoina julkaisemme useita käytännön artikkeleita OpenClawista.

On muutamia käytännön ongelmia, joista haluan varoittaa teitä.

Tämän järjestelmän edellytys on, että sinulla on selkeä tuote, tarkat asiakastarpeet ja toimiva CI/CD-putki. Elvis tekee todellista B2B SaaS -tuotetta, jossa on asiakkaita, tuloja ja tuotantoympäristö. Jos olet vielä kirjoittamassa demoja tai oppimisvaiheessa, tämän arkkitehtuurin ROI ei ehkä ole kannattava.

Lisäksi OpenClawin nykyiset turvallisuusongelmat on myös otettava huomioon. Julkisten tietojen mukaan useita korkeita CVE:itä on paljastettu, ja 341 haitallista yhteisöliitännäistä on löydetty, joissa on tietojen varastamista. OpenClawin käyttöönotossa eristys ja käyttöoikeuksien hallinta on ehdottomasti tehtävä hyvin. Tämä on myös syy, miksi en ole koskaan ottanut OpenClawia käyttöön paikallisella pääkoneellani.

Lisäksi Elvis arvioi twiiteissään Claude Coden koodin tarkastusta melko alhaiseksi, mutta äskettäin Claude Code julkaisi Agent Teams -toiminnon (virallisesti sisäänrakennettu monen Agentin yhteistyö), ja Anthropic suuntaa myös kohti orkestrointia.

Mutta jättäen nämä yksityiskohdat huomiotta, Elvisin tämä orkestrointi- ja suorituskerroksen arkkitehtuuriajatus on todellakin huomionarvoinen. Kontekstin ikkunan nollasummapeli on todellinen rajoite, ja kerroksellista arkkitehtuuria käyttämällä tämän ongelman ratkaiseminen, jotta eri AI:t voivat toimia omissa rooleissaan, on mielestäni oikea suunta.[[HTMLPLACEHOLDER0]][[HTMLPLACEHOLDER_1]]