OpenClaw + Claude Code/Codex：Ndërto një Agregat Zhvillimi Personal

Përshëndetje të gjithëve, unë jam Lu Gong.

Pak kohë më parë, pashë një tweet në X që më tërhoqi menjëherë vëmendjen. Një zhvillues i pavarur i quajtur Elvis tha se tani nuk e përdor më drejtpërdrejt Claude Code dhe Codex, por ka kaluar në OpenClaw si një shtresë organizuese, duke lejuar një AI organizues të quajtur Zoe të menaxhojë një grup të tërë të Agjentëve Claude Code dhe Codex.

Të dhënat e këtij tweet-i ishin gjithashtu të mahnitshme, 4.9 milion shikime, 11 mijë pëlqime, 1800 shpërndarje.

Ne kemi shkruar për Vibe Coding për më shumë se katër muaj, dhe Claude Code ka qenë gjithmonë mjeti kryesor. Unë kam shkruar më parë disa artikuj të tjerë në lidhje me bashkëpunimin e shumë Agjentëve, arkitekturën e shumë Agjentëve në VSCode dhe të tjera.

Por kur pashë këtë mënyrë të punës nga Elvis, nuk mund të mos e quaja atë një profesionist. Një person, me një sistem organizimi, bën mesatarisht 50 dorëzime kod në ditë, dhe në ditën më të fuqishme dorëzoi 94 herë, duke pranuar gjithashtu 3 telefonata nga klientët, pa hapur asnjëherë redaktorin.

A nuk është kjo si të kesh një ekip zhvillimi me një person?

Sot, ky artikull do të shqyrtojë se si e arriti këtë.

OpenClaw nuk është e panjohur për askënd

Ky rak i vogël ka qenë i njohur që nga festa e Vitit të Ri Kinez. Thjesht, është një kornizë e hapur për Agjentë AI, me më shumë se 240,000 yje në GitHub, dhe para dy ditësh kaloi zyrtarisht React, duke u bërë projekti i hapur me rritjen më të shpejtë të yjeve në historinë e GitHub.

Themeluesi Peter Steinberger është një zhvillues austriak, i cili më parë kishte krijuar PSPDFKit (një kompani B2B për korniza PDF), dhe në vitin 2021 mori një investim prej 100 milion eurosh nga Insight Partners. Në shkurt të këtij viti, Peter njoftoi se do të bashkohej me OpenAI, dhe projekti OpenClaw u transferua për t'u operuar nga një fondacion i hapur.

Pozita e OpenClaw nuk është një robot bisedues, por një kohë ekzekutimi për Agjentë AI që funksionon në pajisjen tuaj lokale. Ka katër komponentë kryesorë: Gateway (portë, lidh 50+ platforma mesazhesh), Agent (motor inferencë), Skills (më shumë se 5400 plugina), Memory (sistem kujtese).

Por mënyra se si Elvis përdor OpenClaw është mjaft e veçantë. Ai e përdor atë si një shtresë organizuese, veçanërisht për të menaxhuar këta Agjentë kodimi Claude Code dhe Codex, pa e përdorur atë si ndihmës të përgjithshëm.

Ky koncept është me të vërtetë i pazakontë.

Pse nevojitet një shtresë organizuese?

Elvis përmendi një pikë shumë të rëndësishme në tweet-in e tij: dritarja e kontekstit është një lojë me zero.

Nëse e mbushni atë me kod, nuk ka hapësirë për kontekstin e biznesit. Nëse e mbushni me historinë e klientëve dhe shënimet e takimeve, nuk ka hapësirë për bibliotekën e kodit. Edhe një AI i vetëm, sa i fuqishëm që të jetë, nuk mund të mbajë të dyja këto lloje informacioni të ndryshme në të njëjtën kohë.

Prandaj, ai e ndau sistemin në dy shtresa.

Shtresa e sipërme është organizuesi OpenClaw, Zoe, e cila zotëron të gjithë kontekstin e biznesit, duke përfshirë të dhënat e klientëve, shënimet e takimeve, vendimet historike, cilat propozime janë provuar, cilat kanë dështuar. Këto informacione janë të gjitha në bibliotekën e shënimeve Obsidian të Elvisit, dhe Zoe mund t'i lexojë ato drejtpërdrejt.

Shtresa e poshtme janë këta Agjentë kodimi Claude Code dhe Codex, të cilët shohin vetëm kodin, vetëm shkruajnë kod. Kur çdo Agjent aktivizohet, Zoe do t'i shkruajë një prompt të saktë sipas kontekstit të biznesit, duke i thënë se çfarë duhet të bëjë, cila është sfondi, çfarë kërkon klienti.

Thjesht, organizuesi është përgjegjës për të kuptuar nevojat, Agjentët e kodimit janë përgjegjës për të punuar. Secili bën atë që di të bëjë më mirë.

Kjo arkitekturë është e ngjashme me sistemin e brendshëm Minions të Stripe që u publikua kohët e fundit. Minions e Stripe gjithashtu ka një dizajn të Agjentëve të kodimit paralel dhe një shtresë organizuese qendrore, duke mundësuar bashkimin e më shumë se 1000 PR-ve të shkruara plotësisht nga AI çdo javë. Elvis tha se ai e ndihmoi rastësisht të krijonte një arkitekturë të ngjashme, vetëm se ajo funksionon në Mac mini të tij.

Rasti i vërtetë i punës

Elvis përdori një rast të vërtetë në tweet-in e tij për të treguar rrjedhën e tij të plotë të punës, unë do ta përmbledh disa nga fazat kryesore.Ai mori një telefonatë nga një klient, i cili dëshironte të ripërdorte konfigurimet ekzistuese brenda ekipit. Pas bisedës, ai bisedoi me Zoe për këtë kërkesë. Sepse të gjitha shënimet e takimeve sinkronizohen automatikisht në Obsidian, Zoe tashmë e dinte se çfarë tha klienti, nuk kishte nevojë që Elvis të shpjegonte më shumë. Ata së bashku përcaktuan fushën e funksionalitetit, dhe plani përfundimtar ishte të krijonin një sistem template.

Pastaj Zoe automatikisht bëri tre gjëra: i dha klientit shërbimin e zhbllokimit (ajo kishte privilegje API administrator), tërheqi konfigurimin ekzistues të klientit nga databaza e prodhimit (privilegje leximi, Agjenti i kodimit kurrë nuk do të ketë këtë privilegj), dhe më pas krijoi një Codex Agent, me një prompt të detajuar që përmbante kontekstin e plotë të biznesit.

Çdo Agjent ka worktree të tij të pavarur (dega e izoluar) dhe seancë tmux. Komanda e nisjes është diçka e tillë:

# Krijo worktree + nis agjentin git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high" Pas nisjes së Agjentit, ka një detyrë të planifikuar që kontrollon çdo 10 minuta. Por ai nuk do të pyesë drejtpërdrejt Agjentin (sepse do të shpenzonte shumë token), por do të ekzekutonte një skript Shell të caktuar, për të kontrolluar nëse seanca tmux është ende aktive, nëse ka krijuar PR, dhe nëse CI ka kaluar.

Nëse CI dështon, Agjenti restartohet automatikisht, me maksimumi 3 përpjekje. Njoftimi dërgohet vetëm kur kërkohet ndërhyrje manuale.

Pas përfundimit të detyrës, Agjenti do të krijojë automatikisht një PR. Por thjesht krijimi i PR nuk është fundi, Elvis përcaktoi një grup standardesh për përfundimin: krijimi i PR, sinkronizimi i degës në main (pa konflikte bashkimi), CI të kalojë të gjitha, shqyrtimi i kodit nga tre modelet AI të kalojë të gjitha, dhe nëse ka ndryshime në UI, duhet të bashkëngjitet një screenshot.

Tre Modelet AI për Shqyrtimin e Kodit

Tre modelet AI për shqyrtimin e kodit duken shumë të qëndrueshme. Të flasim pak për vlerësimin e tij për këto tre modele, është mjaft interesante.

Codex Reviewer, ai e vlerëson më së larti, duke thënë se shqyrtimi i tij në rastet kufitare dhe gabimet logjike është shumë i plotë, me një normë të ulët të gabimeve të rreme.

Gemini Code Assist Reviewer, falas, ai thotë se është shumë i dobishëm, mund të zbulojë rreziqet e sigurisë dhe problemet e zgjerueshmërisë që modelet e tjera kanë lënë pas, dhe gjithashtu mund të ofrojë zgjidhje specifike për riparim.

Claude Code Reviewer, fjalët e tij ishin "në thelb i padobishëm", duke thënë se është tepër i kujdesshëm, me shumë sugjerime si "mendoni të shtoni...", shumica e të cilave i përkasin dizajnit të tepruar. Përveç nëse është e shënuar si një problem kritik, ai thjesht e kalon.

Kur e pashë këtë pjesë, u befasova pak. Si një përdorues i rëndësishëm i Claude Code, unë gjithashtu kam hasur raste kur ai ishte tepër konservator në shqyrtimin e kodit, por vlerësimi "në thelb i padobishëm" është paksa ekstrem. Megjithatë, kjo gjithashtu tregon se shqyrtimi i kryqëzuar nga shumë modele ka vlerë, paragjykimet e ndryshme të modeleve plotësojnë njëra-tjetrën.

Pasi të kalojnë të tre shqyrtimet, Elvis do të marrë një njoftim në Telegram. Në këtë pikë, ai kryesisht shikon screenshot-et, për të konfirmuar nëse ndryshimet në UI janë të sakta, shumë PR ai i bashkon direkt pa e parë kodin. Ai thotë se shqyrtimi i tij manual kërkon vetëm 5 deri në 10 minuta.

Proaktiviteti i Zoe-s

Zoe nuk është vetëm një ekzekutues. Më interesante se vetë rrjedha e punës është proaktiviteti i Zoe-s.

Elvis thotë se Zoe nuk pret që t'i caktohet një detyrë, ajo aktivisht kërkon punë për të bërë. Në mëngjes skanon logun e gabimeve në Sentry, zbulon 4 gabime të reja, dhe automatikisht krijon 4 Agjentë për t'i riparuar. Pas takimeve, skanon shënimet e takimeve, shënon 3 kërkesat funksionale që përmendi klienti, dhe më pas automatikisht nis 3 Codex Agjentë. Në mbrëmje skanon logun e Git-it, nis Claude Code për të përditësuar changelog-un dhe dokumentacionin për klientin.

Kur Elvis del për një shëtitje dhe kthehet, në Telegram ka një mesazh: 7 PR janë gati, 3 funksione të reja, 4 riparime gabimesh. A nuk është kjo ajo që kam pritur gjithmonë për të krijuar efektin e ekipit të zhvillimit të kompanisë OPC me një person?Dhe kur Agjenti dështon, mënyra e trajtimit të Zoe-s është shumë më e avancuar se një thjesht provë e re. Ajo do të analizojë arsyet e dështimit duke kombinuar kontekstin e biznesit. A është konteksti i Agjentit i prishur? Ajo do ta ngushtojë gamën, duke i bërë Agjentit të përqendrohet vetëm në tre skedarë. A është drejtimi i Agjentit i gabuar? Ajo gjithashtu do ta korrigjojë, duke i thënë Agjentit se klienti dëshiron X, jo Y, dhe duke përfshirë fjalët origjinale nga takimi.

Me kalimin e kohës, Zoe gjithashtu do të akumulojë përvojë, duke mbajtur mend se cilat struktura promptesh funksionojnë mirë për cilat lloje detyrash, duke shkruar një prompt më të saktë herën tjetër.

Ky koncept është në thelb një version i përmirësuar i Ralph Loop. Logjika kryesore e Ralph Loop është tërheqja e kontekstit, gjenerimi i daljes, vlerësimi i rezultateve, ruajtja e përvojës në një cikël, por shumica e implementimeve kanë një prompt të fiksuar për çdo cikël. Sistemi i Elvis-it është ndryshe; çdo herë që provon përsëri, Zoe do të rregullojë dinamikisht promptin në varësi të arsyes së dështimit, dhe ka një kontekst të plotë biznesi për ta mbështetur.

Kostot dhe Hardueri

Sa i përket kostove, të dhënat e publikuara nga Elvis janë se Claude kushton rreth 100 dollarë në muaj, Codex rreth 90 dollarë në muaj. Ai gjithashtu tha se mund të filloni me 20 dollarë për të provuar.

Kjo kosto është padyshim shumë më e lirë se sa të punësosh një zhvillues. Por nëse merrni parasysh se duhet të bëni vendime për produktin, komunikim me klientët, rishikim të kodit, ajo duket më shumë si një amplifikator efikasie, duke ju ndihmuar të kurseni në kodim dhe testim, që janë fazat më të përsëritura.

Sa i përket harduerit, Elvis përmendi se ngushtica e tij më e madhe aktualisht është RAM-i. Çdo Agjent ka nevojë për një worktree të pavarur, çdo worktree ka node_modules të tijat, çdo Agjent duhet të ekzekutojë ndërtimin, kontrollin e tipeve dhe testimin. 5 Agjentë që ekzekutohen njëkohësisht do të thotë 5 kompilerë TypeScript paralelë, 5 ekzekutorë testesh, 5 grupe varësish.

Mac mini i tij me 16GB RAM mund të ekzekutojë maksimumi 4 deri në 5 Agjentë njëkohësisht, më shumë se kaq fillon të shkëmbejë memorien. Prandaj ai bleu një Mac Studio M4 Max me 128GB RAM (3500 dollarë), me qëllim që ta përdorë për të mbajtur më shumë Agjentë në mënyrë të paralel.

Përmbledhje dhe Problemet Reale

Sinqerisht, sistemi i Elvis-it më ka bërë një ndikim të madh. Deri tani, unë e kam parë OpenClaw si një lodër, dhe për ndihmën në prodhim, kam mbështetur në Claude Code të pavarur. Herë pas here përdor worktree për paralelizëm, por aspak në këtë nivel të organizimit sistematik. Pas leximit të tweet-it të tij, mendoj se kufiri i programimit AI është ngritur përsëri.

Së fundmi, po ndjek mendimin e tij, duke u përgatitur të krijoj një ekip zhvillimi të plotë automatizuar me OpenClaw. Prandaj, së shpejti do të publikojmë disa artikuj praktikë për OpenClaw.

Ka disa probleme reale që duhet t'i kujtojmë.

Kjo sistemim kërkon që të keni një produkt të qartë, kërkesa të qarta nga klientët, dhe një linjë CI/CD të plotë. Elvis po krijon një produkt të vërtetë B2B SaaS, ka klientë, të ardhura, dhe një mjedis prodhimi. Nëse jeni ende në fazën e shkrimit të Demo-s ose të mësimit, ROI i kësaj arkitekture mund të mos jetë shumë i favorshëm.

Për më tepër, problemi i sigurisë së OpenClaw gjithashtu duhet të merret parasysh. Sipas informacionit të publikuar, tashmë janë zbuluar disa CVE të rrezikshme, dhe janë gjetur 341 plugina të komunitetit të keq që kanë sjellë sjellje të vjedhjes së të dhënave. Kur të vendosni OpenClaw, izolimi dhe kontrolli i autorizimeve duhet të bëhen mirë. Kjo është gjithashtu arsyeja pse unë nuk e kam vendosur OpenClaw në makinat e mia kryesore lokale.

Një pikë tjetër, Elvis në tweet-in e tij ka vlerësuar ulët rishikimin e kodit të Claude Code, por së fundmi Claude Code sapo ka lançuar funksionin Agent Teams (bashkëpunimi i shumë Agjentëve të integruar nga zyrtarët), dhe Anthropic gjithashtu po punon në këtë drejtim.

Megjithatë, duke lënë mënjanë këto detaje, koncepti i Elvis-it për arkitekturën e nivelit të organizimit dhe ekzekutimit është me të vërtetë i rëndësishëm për t'u vlerësuar. Loja e zero-sum në dritaren e kontekstit është një kufizim real, dhe përdorimi i një arkitekture të ndarë për të zgjidhur këtë problem, duke lejuar që AI të ketë rolet e saj, mendoj se është drejtimi i duhur....