OpenClaw + Claude Code/Codex: Búa til persónulega þróunaraðila svarm
OpenClaw + Claude Code/Codex: Búa til persónulega þróunaraðila svarm
Halló allir, ég er Lu Gong.
Fyrir stuttu síðan sá ég á X tweet sem heillaði mig strax. Óháður þróunaraðili að nafni Elvis sagði að hann notaði ekki lengur Claude Code og Codex beint, heldur notaði OpenClaw sem skipulagshjúp til að láta AI skipuleggjandann Zoe stjórna heilu Claude Code og Codex þróunaraðila svarminum.
Gögnin um þennan tweet eru líka mjög áhrifamikil, 4,9 milljónir skoðana, 11.000 líkar, 1800 deilingar.
Við höfum skrifað Vibe Coding í meira en fjóra mánuði, Claude Code hefur alltaf verið aðalverkfærið. Ég hef áður skrifað um samvinnu milli margra aðila, VSCode margra aðila arkitektúr og aðrar sambærilegar greinar.
En þegar ég sá þessa aðferð Elvis, gat ég aðeins kallað hann sérfræðing. Einn maður, með eina skipulagshugmynd, gerir að meðaltali 50 kóðaskil á dag, og á einum degi gerði hann 94, en tók líka þrjú símtöl frá viðskiptavinum, án þess að opna ritstjórann einu sinni.
Er þetta ekki eins og einn maður sé að vinna sem þróunarteymi?
Í dag mun þessi grein skoða hvernig hann gerði þetta.
OpenClaw er öllum kunnugur
Þessi litla rækja hefur verið vinsæl síðan fyrir kínverska nýárs. Í einfaldri skýringu er þetta opinn AI aðgerðarammi, með meira en 240.000 stjörnur á GitHub, og nýlega hefur það farið fram úr React og orðið það opna verkefni á GitHub sem hefur vaxið hraðast í stjörnum í sögu GitHub.
Fyrirliðinn Peter Steinberger er austurrískur þróunaraðili, sem áður stofnaði PSPDFKit (B2B fyrirtæki fyrir PDF ramma), og fékk 100 milljónir evra fjárfestingu frá Insight Partners árið 2021. Í febrúar í ár tilkynnti Peter að hann myndi ganga til liðs við OpenAI, og OpenClaw verkefnið var fært til rekstrar opinberrar sjóðs.
OpenClaw er ekki spjallmenni, heldur AI aðgerð sem keyrir á þínum staðbundnu tækjum. Það hefur fjóra kjarnaþætti: Gateway (hlið, tengir meira en 50 skilaboðapalla), Agent (rökhugsunarmiðstöð), Skills (yfir 5400 viðbætur), Memory (minniskerfi).
En aðferð Elvis við að nota OpenClaw er frekar sérstök. Hann notar það beint sem skipulagshjúp, sérstaklega til að stjórna Claude Code og Codex kóðunar aðilum, án þess að nota það sem almennan aðstoðarmann.
Þessi hugsun er sannarlega óvenjuleg.
Af hverju þarf maður skipulagshjúp?
Elvis nefndi mjög mikilvægan punkt í tweetinu: Samhengisglugginn er núll-summu leikur.
Þú getur ekki fyllt honum með kóða án þess að missa pláss fyrir viðskiptaumhverfi. Ef þú fyllir hann með viðskiptasögu og fundargerðum, þá er ekki pláss fyrir kóðasafnið. Einn AI, hvernig sem hann er sterkur, getur ekki haldið báðum þessum ólíkum upplýsingum á sama tíma.
Þess vegna skildi hann kerfið í tvær lög.
Efri lögin er OpenClaw skipuleggjandinn Zoe, sem hefur allar viðskiptaumhverfi, þar á meðal viðskiptagögn, fundargerðir, sögulegar ákvarðanir, hvaða lausnir hafa verið prófaðar, hvaða hafa mistekist. Þessar upplýsingar eru allar í Obsidian skjalasafni Elvis, og Zoe getur lesið þær beint.
Neðri lögin eru Claude Code og Codex kóðunar aðilar, sem sjá aðeins kóðann og skrifa aðeins kóðann. Þegar hver aðili er ræstur, skrifar Zoe nákvæma leiðbeiningu byggða á viðskiptaumhverfi, sem segir honum hvað á að gera, hver bakgrunnurinn er, og hvað viðskiptavinurinn vill.
Í einfaldri skýringu: skipuleggjandinn sér um að skilja kröfurnar, kóðunar aðilarnir sjá um að vinna. Hver gerir það sem hann er bestur í.
Þessi uppbygging er svipuð innri kerfi Stripe, Minions, sem var opinberað fyrir stuttu. Minions Stripe er einnig hönnun á samhliða kóðunar aðilum með miðlægu skipulagshjúp, sem getur sameinað meira en 1000 PR sem eru skrifuð af AI á viku. Elvis sagði að hann hefði óvart byggt svipaða uppbyggingu, bara keyrandi á sínum eigin Mac mini.
Raunveruleg dæmi um vinnuflæði
Elvis notaði raunverulegt dæmi í tweetinu til að útskýra sitt fulla vinnuflæði, ég mun einfaldlega tengja aðalþættina.Hann tók símtal frá viðskiptavini, sem vildi endurnýta núverandi stillingar innan teymisins. Eftir að símtalinu lauk, ræddi hann við Zoe um þessa þörf. Þar sem öll fundargerð er sjálfkrafa samstillt við Obsidian, vissi Zoe þegar hvað viðskiptavinurinn hafði sagt, og þurfti ekki að útskýra það frekar fyrir Elvis. Þeir staðfestu saman umfang aðgerðarinnar, og endanlega lausnin var að búa til sniðmátakerfi.
Þá gerði Zoe sjálfkrafa þrjár hluti: endurfyllti þjónustu fyrir viðskiptavininn (hún hefur stjórnanda API réttindi), dró núverandi stillingar viðskiptavinarins úr framleiðsludatabasinu (lestraréttindi, kóðunar Agent mun aldrei hafa þessi réttindi), og bjó til Codex Agent, með ítarlegum prompt sem inniheldur fullan viðskiptaumhverfi.
Hver Agent hefur sitt eigið sjálfstæða worktree (einkaskiptigrein) og tmux sess. Upphafsskipunin er svona:
# Create worktree + spawn agent git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high"Eftir að Agentinn er kominn í gang, er til staðar tímaskipti sem fer í gegnum það á 10 mínútna fresti. En það spyr ekki beint Agentinn (það myndi brenna of mikið af tokenum), heldur keyrir það ákveðið Shell skrift, sem athugar hvort tmux sessin sé enn lifandi, hvort PR hafi verið búin til, og hvort CI hafi gengið í gegn.
Ef CI bregst, endurræsir það sjálfkrafa Agentinn, að hámarki 3 sinnum. Aðeins þegar þarf að grípa inn í, sendir það tilkynningu.
Eftir að Agentinn hefur lokið verkefninu, býr hann sjálfkrafa til PR. En að búa til PR er ekki nóg, Elvis skilgreindi sett af fullnægingarviðmiðum: PR búin til, grein samstillt við main (án sameiningarátaka), CI öll í gegn, kóðaskoðun á þremur AI líkanum öll í gegn, ef UI breytingar eru til staðar, þarf einnig að fylgja með skjáskot.
Þrjú AI líkan fyrir kóðaskoðun
Þrjú AI líkan fyrir kóðaskoðun virðast vera mjög stöðug. Það er áhugavert að ræða um mat hans á þessum þremur líkanum.
Codex Reviewer, hann metur það hæst, segir að það sé mjög ítarlegt í jaðar- og rökfræðivillum, og að rangar skýrslur séu mjög lágar.
Gemini Code Assist Reviewer, ókeypis, hann segir að það sé mjög gagnlegt, getur fundið öryggisógnir og skalanleika vandamál sem önnur líkan hafa misst af, og getur einnig gefið tilteknar lagfæringar.
Claude Code Reviewer, hans eigin orð eru "nánast ónotað", segir að það sé of varfærnislegt, fullt af tillögum eins og "íhugaðu að bæta við...", flestar tilmæli eru of hönnuð. Nema ef merkt er sem mikilvægt vandamál, þá fer hann beint framhjá því.
Þegar ég sá þetta, var ég smá hissa. Sem mikill notandi Claude Code, hef ég einnig lent í því að það sé of varfærnislegt í kóðaskoðun, en að segja að það sé nánast ónotað er svolítið of mikið. En þetta sýnir einnig að krosskóðun milli margra líkana er í raun dýrmæt, skekkja mismunandi líkana er að skarast.
Eftir að öll þrjú skoðun hafa verið samþykkt, fær Elvis fyrst tilkynningu á Telegram. Á þessu stigi skoðar hann aðallega skjáskot, staðfestir hvort UI breytingar séu réttar, margar PR samþykkir hann beint án þess að skoða kóðann. Hann segir að hans eigin handvirka skoðun taki aðeins 5 til 10 mínútur.
Sjálfvirkni Zoe
Zoe er ekki bara framkvæmdaraðili. Það sem er meira áhugavert en vinnuferlið sjálft er sjálfvirkni Zoe.
Elvis segir að Zoe bíði ekki eftir að henni sé úthlutað verkefni, hún leitar sjálf að verkefnum. Á morgnana skannar hún Sentry villuskýrsluna, finnur 4 nýjar villur, og býr sjálfkrafa til 4 Agents til að laga þær. Eftir fundinn skannar hún fundargerðina, merkir 3 aðgerðir sem viðskiptavinurinn nefndi, og kveikir sjálfkrafa á 3 Codex Agents. Á kvöldin skannar hún Git skýrsluna, kveikir á Claude Code til að uppfæra changelog og skjöl viðskiptavina.
Elvis fer út að ganga og kemur aftur, og á Telegram er ein skilaboð: 7 PR eru tilbúin, 3 nýjar aðgerðir, 4 villulaga. Þetta er ekki það sem ég hef alltaf vonað að búa til, OPC eins manns fyrirtæki þróunarteymi.Og þegar Agent mistekst, þá er Zoe's aðferð mun flóknari en einfaldur endurprófun. Hún mun greina orsökina að mistökunum í samhengi við viðskipti. Er Agent samhengi farið úr böndunum? Hún mun þrengja að, þannig að Agent einbeiti sér aðeins að þremur skrám. Er Agent stefnan að fara úrskeiðis? Hún mun einnig leiðrétta, segja Agent að viðskiptavinurinn vilji X, ekki Y, og fylgja eftir með orðum úr fundinum.
Með tímanum mun Zoe einnig safna reynslu, muna hvaða prompt uppbyggingar virka vel fyrir hvaða tegund verkefna, og skrifa nákvæmari prompt næst.
Þetta hugmyndafræði er í raun uppfærð útgáfa af Ralph Loop. Kjarni Ralph Loop er að draga upp samhengi, búa til úttak, meta niðurstöður, og vista reynslu í slíkum hring, en flestar útfærslur hafa fasta prompt fyrir hvern hring. Kerfið hjá Elvis er öðruvísi, við hverja endurprófun mun Zoe aðlaga promptina dýnamískt eftir orsökum mistakanna, auk þess að hafa fullkomið viðskipta samhengi.
Kostnaður og vélbúnaður
Varðandi kostnað, þá eru opinber gögn Elvis um Claude um 100 dollara á mánuði, Codex um 90 dollara á mánuði. Hann sagði einnig að hægt sé að byrja að prófa með 20 dollara.
Þessi kostnaður er auðvitað ótrúlega ódýr miðað við að ráða forritara. En ef tekið er tillit til þess að þú þarft einnig að taka sjálfur ákvarðanir um vöru, samskipti við viðskiptavini, og kóða endurskoðun, þá er þetta meira eins og skilvirknistækni sem hjálpar þér að spara tíma í kóðun og prófun, sem eru þau endurteknu skref sem taka mestan tíma.
Varðandi vélbúnað, þá nefndi Elvis að hans stærsta hindrun sé RAM. Hver Agent þarf sjálfstæðan worktree, hver worktree hefur sína eigin nodemodules, og hver Agent þarf að keyra byggingu, tegundaskoðun og prófanir. 5 Agents keyra á sama tíma þýðir 5 samhliða TypeScript þýðendur, 5 prófunarkeyrara, og 5 sett af háðum.
Mac mini hans með 16GB minni getur að hámarki keyrt 4 til 5 Agents í einu, meira en það byrjar að skipta um minni. Þess vegna keypti hann 128GB minni Mac Studio M4 Max (3500 dollara), í þeim tilgangi að geta haldið fleiri Agents í samhliða.
Samantekt og raunveruleg vandamál
Heiðarlega sagt, þá hefur kerfið hjá Elvis haft veruleg áhrif á mig. Ég hef áður litið á OpenClaw sem leikfang, en í að byggja upp framleiðni hef ég alltaf treyst á sjálfstæðan Claude Code. Stundum nota ég worktree til að gera samhliða, en langt frá því að ná þessu kerfisbundna stigi. Eftir að hafa lesið tweets hans, finnst mér að hámarkið í AI forritun hafi verið hækkað enn frekar.
Ég er nýlega að fylgja hugmyndum hans, að undirbúa að nota OpenClaw til að búa til algerlega sjálfvirka þróunarteymi. Þannig að við munum fljótlega birta nokkrar greinar um OpenClaw í framkvæmd.
Það eru nokkur raunveruleg vandamál sem ég þarf að vara ykkur við.
Forsenda þessa kerfis er að þú hafir skýra vöru, skýrar kröfur viðskiptavina, og fullkomna CI/CD ferla. Elvis er að búa til raunverulegt B2B SaaS vöru, með viðskiptavinum, tekjum, og framleiðsluumhverfi. Ef þú ert enn að skrifa Demo eða í námskeiði, þá gæti ROI þessa uppbyggingar ekki verið hagkvæm.
Auk þess þarf einnig að vera vakandi fyrir öryggisvandamálum OpenClaw. Samkvæmt opinberum upplýsingum hafa þegar verið afhjúpuð mörg hættuleg CVE, og 341 illgjarnir samfélagsviðbætir hafa verið uppgötvaðir með gögn stuld. Þegar þú setur upp OpenClaw, þá verður að tryggja einangrun og réttindi. Þetta er einnig ástæðan fyrir því að ég hef ekki sett OpenClaw upp á aðalvélina mína.
Einnig er eitt, Elvis hefur gefið Claude Code í tweetum sínum lága einkunn í kóða endurskoðun, en nýlega hefur Claude Code nýverið kynnt Agent Teams eiginleika (opinber innbyggð samvinnu milli Agents), og Anthropic er einnig að vinna í að þróa í þessa átt.
En að sleppa þessum smáatriðum, þá er uppbygging Elvis með skipulagshluta og framkvæmdarhluta virkilega athyglisverð. Nul-summan í samhengi gluggans er raunveruleg takmörkun, að nota lagaskiptingu til að leysa þetta vandamál, láta mismunandi AI sinna sínum hlutum, þetta er í mínum huga rétt stefna.[[HTMLPLACEHOLDER_0]]

