OpenClaw + Claude Code/Codex:打造个人开发Agent Swarm
OpenClaw + Claude Code/Codex:打造个人开发Agent Swarm
Сайн уу, би Лу Гонг.
Саяхан X дээр нэг твит харсан, тэр даруй надад сонирхолтой санагдсан. Элвис гэдэг бие даасан хөгжүүлэгч хэлэхдээ, одоо Claude Code болон Codex-ийг шууд ашиглахаа больсон, OpenClaw-ийг зохион байгуулалтын давхарга болгон ашиглаж, Zoe гэдэг AI зохион байгуулагчийг Claude Code болон Codex-ийн Agent Swarm-ыг удирдахад ашиглаж байна.
Энэ твитийн мэдээлэл ч их сонирхолтой, 4.9 сая үзэлт, 11 мянган лайк, 1800 дахин хуваалцсан.
Бид Vibe Coding-ийг дөрвөн сар гаруй хугацаанд бичиж байгаа бөгөөд Claude Code үргэлж гол хэрэгсэл байлаа. Би өмнө нь олон Agent хамтын ажиллагаа, VSCode олон Agent архитектур гэх мэт сэдвээр хэд хэдэн нийтлэл бичиж байсан.
Гэхдээ Элвисийн энэ арга барилыг хараад би мэргэжлийн хүн гэж дуу алдсан. Нэг хүн, нэг зохион байгуулалтын системээр, өдөрт дунджаар 50 удаа код оруулж, хамгийн хүчтэй өдөр 94 удаа код оруулж, 3 клиентын утас хүлээн авч, редакторыг нэг ч удаа нээгээгүй.
Энэ бол нэг хүн хөгжлийн багийн үүрэг гүйцэтгэж байна гэсэн үг биш үү?
Өнөөдрийн энэ нийтлэлд тэр хэрхэн ийм зүйл хийснийг задлан шинжлэх болно.
OpenClaw-тай бид танил болсон
Энэ жижиг хавчны тухай шинэ жилээс хойш ихээхэн алдартай болсон. Энгийнээр хэлбэл, энэ нь нээлттэй эхийн AI Agent рамк бөгөөд GitHub дээр одоогоор 240,000 гаруй одтой, хоёр өдрийн өмнө React-ийг албан ёсоор давж, GitHub-ийн түүхэнд одны өсөлтөөр хамгийн хурдан нээлттэй төсөл болсон.
Үүсгэн байгуулагч Петер Штайнбергер нь Австрийн хөгжүүлэгч бөгөөд өмнө нь PSPDFKit (PDF рамкийн B2B компани) байгуулж байсан, 2021 онд Insight Partners-аас 100 сая еврогийн хөрөнгө оруулалт авсан. Энэ оны 2-р сард Петер OpenAI-д нэгдсэн бөгөөд OpenClaw төсөл нь нээлттэй эхийн сангийн удирдлагад шилжсэн.
OpenClaw-гийн байрлал нь чатбот биш, таны локал төхөөрөмж дээр ажилладаг AI Agent гүйцэтгэгч юм. Энэ нь дөрвөн гол бүрэлдэхүүн хэсэгтэй: Gateway (гүүр, 50 гаруй мессежийн платформыг холбодог), Agent (дүгнэлт гаргах хөдөлгүүр), Skills (5400 гаруй нэмэлт), Memory (санах ой систем).
Гэхдээ Элвис OpenClaw-ийг ашиглах арга нь онцгой. Тэрээр үүнийг зохион байгуулалтын давхарга болгон ашиглаж, Claude Code болон Codex-ийн код бичих Agent-уудыг удирдахад зориулав, үүнийг ерөнхий туслах болгон ашиглаагүй.
Энэ санаа үнэхээр онцгой.
Яагаад зохион байгуулалтын давхарга хэрэгтэй вэ?
Элвис твитдээ нэг чухал үзэл баримтлалыг дэвшүүлсэн: кон텍стын цонх нь тэгийн тоглоом.
Та дотогш код оруулбал, бизнесийн контекстэд байрлах зай байхгүй болно. Та тэнд клиентын түүх болон уулзалтын тэмдэглэл оруулбал, кодын сангийн зай байхгүй болно. Нэг AI хэдий хүчтэй байсан ч, тэр хоёр өөр төрлийн мэдээллийг зэрэгцүүлэн хадгалах боломжгүй.
Тиймээс тэр системийг хоёр давхаргад хуваажээ.
Дээд давхарга нь OpenClaw-ийн зохион байгуулагч Zoe бөгөөд тэр бүх бизнесийн контекстийг мэддэг, үүнд клиентын мэдээлэл, уулзалтын тэмдэглэл, түүхийн шийдвэр, ямар төлөвлөгөө туршиж үзсэн, ямар нь амжилтгүй болсон зэрэг орно. Эдгээр мэдээлэл бүгд Элвисийн Obsidian тэмдэглэлийн сан дээр хадгалагдсан бөгөөд Zoe шууд уншиж чадна.
Доод давхарга нь Claude Code болон Codex-ийн код бичих Agent-ууд бөгөөд тэд зөвхөн кодыг харж, код бичихэд анхаардаг. Бүх Agent эхлэх үед, Zoe бизнесийн контекстын дагуу тэдэнд нарийн prompt бичиж, юу хийх, ямар фон, клиент юу хүсэж байгааг хэлдэг.
Энгийнээр хэлбэл: зохион байгуулагч шаардлагыг ойлгох үүрэгтэй, код бичих Agent ажил хийх үүрэгтэй. Бүгд өөрийн мэргэжилдээ анхаардаг.
Энэ архитектур нь Stripe-ийн саяхан танилцуулсан дотоод систем Minions-тай төстэй. Stripe-ийн Minions нь параллель код бичих Agent-ууд болон төвлөрсөн зохион байгуулалтын давхаргын загвар бөгөөд долоо хоногт 1000 гаруй AI-гаар бичигдсэн PR-ийг нэгтгэж чаддаг. Элвис хэлэхдээ, тэрээр санамсаргүйгээр ижил архитектурыг байгуулсан, зөвхөн өөрийн Mac mini дээр ажиллаж байна.
Жинхэнэ жишээний ажиллах урсгал
Элвис твитдээ жинхэнэ жишээг ашиглан өөрийн бүрэн ажиллах урсгалыг тайлбарласан, би гол үе шатуудыг энгийнээр холбож байна.Тэр нэгэн үйлчлүүлэгчийн утасны дуудлага авсан бөгөөд үйлчлүүлэгч багийн доторх байгаа тохиргоог дахин ашиглахыг хүссэн. Утсаар яриа дууссаны дараа тэр Зое-тай энэ шаардлагын талаар ярилцсан. Бүх хурлын тэмдэглэл автомат байдлаар Obsidian-д синхронддог тул Зое үйлчлүүлэгч юу хэлснийг аль хэдийн мэдэж байсан, Элвис нэмэлт тайлбар хийх шаардлагагүй. Тэд хамтдаа функцийн хүрээг тодорхойлсон бөгөөд эцсийн төлөвлөгөө нь загварын систем хийх явдал байв.
Дараа нь Зое автомат байдлаар гурван зүйл хийсэн: үйлчлүүлэгчид үйлчилгээний төлбөрийг нэмэгдүүлэх (тэр администратор API эрхтэй), үйлдвэрлэлийн өгөгдлийн сангаас үйлчлүүлэгчийн одоогийн тохиргоог татаж авах (зөвхөн унших эрх, кодын агент үргэлж энэ эрхтэй байхгүй), дараа нь бүрэн бизнесийн контекст бүхий дэлгэрэнгүй prompt-тай Codex Agent үүсгэх.
Бүх Agent-ууд өөрийн бие даасан worktree (тусгаарласан салбар) болон tmux сесситай. Эхлүүлэх команд нь дараах байдлаар байна:
# Create worktree + spawn agent git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex highAgent ажиллаж эхлэхэд, 10 минут тутамд шалгалт хийх цагийн даалгавар байдаг. Гэхдээ энэ нь Agent-ийг шууд асуухгүй (тэр нь token-ийг ихээр зарцуулна), харин тодорхой Shell скрипт ажиллуулж, tmux сесс нь амьд байгаа эсэх, PR үүсгэсэн эсэх, CI нь амжилттай өнгөрсөн эсэхийг шалгадаг.
Хэрэв CI амжилтгүй бол, Agent-ийг автомат байдлаар дахин эхлүүлж, хамгийн ихдээ 3 удаа дахин оролдоно. Зөвхөн хүний оролцоо шаардлагатай үед л мэдэгдэл илгээнэ.
Agent даалгавраа дуусгасны дараа автомат байдлаар PR үүсгэнэ. Гэхдээ PR үүсгэх нь хангалтгүй, Элвис гүйцэтгэлийн стандартын нэг системийг тодорхойлсон: PR үүсгэх, салбарыг main-д синхрончлох (нэгдэл зөрчилгүй), CI бүгдийг амжилттай давж, гурван AI загварын кодын хяналт бүгдийг амжилттай давж, хэрэв UI өөрчлөлт байвал скрийншот хавсаргах шаардлагатай.
Гурван AI загвар кодын хяналт
Гурван AI загвар кодын хяналт хийх нь үнэхээр найдвартай харагдаж байна. Тэр гурван загварыг үнэлэхдээ сонирхолтой зүйлс ярьсан.
Codex Reviewer, тэр хамгийн өндөр үнэлгээ өгсөн, учир нь энэ нь хязгаарын нөхцөл болон логикийн алдааны хяналт маш гүнзгий, алдааны хувь маш бага.
Gemini Code Assist Reviewer, үнэгүй, тэр хэлэхдээ маш хэрэгтэй, бусад загваруудын алдаж орхисон аюулгүй байдлын эрсдэл болон өргөтгөх боломжийн асуудлуудыг олж чаддаг, мөн тодорхой засварлах төлөвлөгөө өгдөг.
Claude Code Reviewer, түүний үгс "бараг хэрэггүй" гэж хэлсэн, учир нь энэ нь хэт болгоомжтой, "нэмэхийг бодож үзэх..." гэх мэт зөвлөмжүүдээр дүүрэн, ихэнх нь хэт их дизайны асуудал. Гол асуудал гэж тэмдэглээгүй бол тэр шууд алгасдаг.
Би энэ хэсгийг уншихад жаахан гайхсан. Claude Code-ийн хүнд хэрэглэгчийн хувьд, би үнэхээр кодын хяналтын үед хэт болгоомжтой байдалтай тулгарч байсан ч "бараг хэрэггүй" гэсэн үнэлгээ нь жаахан хэтэрсэн. Гэхдээ энэ нь олон загварын хөндлөн хяналт үнэхээр үнэ цэнэтэй гэдгийг харуулж байна, учир нь өөр өөр загваруудын урвалын ялгаа яг тохирч байна.
Гурван хяналт бүгдийг амжилттай давсны дараа Элвис Telegram мэдэгдэл авна. Энэ шатанд тэр ихэвчлэн скрийншотыг харж, UI өөрчлөлт зөв эсэхийг баталгаажуулдаг, олон PR-ыг кодыг харалгүйгээр шууд нэгдүүлдэг. Тэр өөрийн хүний хяналтыг 5-10 минутын дотор дуусгадаг.
Зое-ийн идэвхтэй байдал
Зое зөвхөн гүйцэтгэгч биш. Ажиллах урсгалынхаа илүү сонирхолтой зүйл бол Зое-ийн идэвхтэй байдал.
Элвис хэлэхдээ Зое үүрэг даалгавар хүлээж авахыг хүлээхгүй, тэр идэвхтэйгээр ажил хайдаг. Өглөө Sentry-ийн алдааны логыг сканердаж, 4 шинэ алдааг олж, 4 Agent автомат байдлаар үүсгэдэг. Хурал дууссаны дараа хурлын тэмдэглэлийг сканердаж, үйлчлүүлэгчийн дурдсан 3 функцийн шаардлагыг тэмдэглэж, дараа нь 3 Codex Agent автомат байдлаар эхлүүлдэг. Орой Git логыг сканердаж, Claude Code-ийг changelog болон үйлчлүүлэгчийн баримт бичгийг шинэчлэхийн тулд эхлүүлдэг.
Элвис гадаа алхаж ирэхэд, Telegram дээр нэг мессеж ирсэн: 7 PR бэлэн болсон, 3 шинэ функц, 4 алдаа зассан. Энэ нь би үргэлж хүсч байсан OPC нэг хүний компани хөгжлийн багийн үр дүн биш гэж үү?Мөн Agent алдахад, Zoe-ийн шийдэл нь энгийн дахин оролдохоос илүү дэвшилтэт. Энэ нь бизнесийн контекстыг хослуулан алдааны шалтгааныг шинжлэх болно. Agent контекст алдагдсан уу? Энэ нь хүрээгээ багасгаж, Agent-г зөвхөн гурван файлын талаар анхааруулах болно. Agent-ийн чиглэл буруу болсон уу? Энэ нь ч бас засаж, Agent-д хэрэглэгчийн хүсч буй зүйл нь X, Y биш гэдгийг хэлж, уулзалтын үеийн үгсийг хавсаргана.\n\nЦаг хугацаа өнгөрөхийн хэрээр, Zoe туршлага хуримтлуулж, ямар prompt бүтэц ямар төрлийн даалгаварт сайн нөлөөтэйг санаж, дараагийн удаа илүү нарийвчилсан prompt бичих болно.\n\nЭнэ санаа нь үнэндээ Ralph Loop-ийн шинэчлэгдсэн хувилбар юм. Ralph Loop-ийн гол логик нь контекстыг татаж авах, гаралтыг үүсгэх, үр дүнг үнэлэх, туршлагыг хадгалах гэсэн тойрог боловч ихэнх хэрэгжүүлэлт нь тойрог бүрийн prompt-ыг тогтмол байлгадаг. Elvis-ийн систем өөр, дахин оролдох бүрт Zoe алдааны шалтгаанаас хамааран prompt-ыг динамик байдлаар тохируулдаг бөгөөд бүрэн бизнесийн контекстыг дэмждэг.\n\n## Зардал ба тоног төхөөрөмж\n\nЗардлын хувьд, Elvis-ийн нээлттэй мэдээлэл нь Claude сар бүр ойролцоогоор 100 доллар, Codex сар бүр ойролцоогоор 90 доллар гэж байна. Тэр бас хэлсэн, эхлээд 20 доллароос эхлэн туршиж үзэж болно.\n\nЭнэ зардал нь хөгжүүлэгчийг ажилд авахтай харьцуулахад үнэхээр хямд. Гэхдээ та өөрөө бүтээгдэхүүний шийдвэр гаргах, хэрэглэгчийн харилцаа, кодын хяналт хийх шаардлагатайг бодвол, энэ нь илүүтэйгээр үр ашиг нэмэгдүүлэгч шиг, код бичих болон тестлэх зэрэг давтагддаг үе шатуудыг хэмнэхэд тусалдаг.\n\nТоног төхөөрөмжийн хувьд, Elvis одоогийн хамгийн том саад нь RAM гэж дурдсан. Бүх Agent тусдаа worktree шаардлагатай, бүр worktree нь өөрийн node_modules-тай, бүр Agent нь барилга, төрөл шалгалт, тестийг гүйцэтгэх шаардлагатай. 5 Agent зэрэг ажиллах нь 5 параллель TypeScript компилятор, 5 тестийн гүйцэтгэгч, 5 багц хамаарлыг шаарддаг.\n\nТүүний Mac mini 16GB RAM-тай хамгийн ихдээ 4-5 Agent зэрэг ажиллуулж чадна, илүү их байвал RAM солилцох болно. Тиймээс тэр 128GB RAM-тай Mac Studio M4 Max (3500 доллар) худалдаж авсан бөгөөд илүү олон Agent-ийн зэрэгцээ ажиллахыг хүсч байна.\n\n## Дүгнэлт ба бодит асуудлууд\n\nЧин сэтгэлээсээ хэлэхэд, Elvis-ийн энэ систем надад ихээхэн нөлөөлсөн. Би OpenClaw-г тоглоомын хэрэгсэл гэж үзэж байсан бөгөөд үйлдвэрлэлийн бүтээмжийг бий болгоход би бие даасан Claude Code-д найдаж байсан. Заримдаа worktree-г параллель хийх боловч ийм системчилсэн зохион байгуулалтын түвшинд хүрээгүй. Түүний твитийг уншсаны дараа, AI програмчлалын энэ асуудлын хязгаар дахин өндөрссөн гэж бодож байна.\n\nБи с最近 түүний санааг дагаж, OpenClaw-ыг бүрэн автоматжуулсан нэг хүний хөгжлийн багийг бий болгохоор төлөвлөж байна. Тиймээс, удахгүй бид OpenClaw-ийн практик нийтлэлүүдийг олон удаа гаргах болно.\n\nЗарим бодит асуудлуудыг анхааруулах хэрэгтэй.\n\nЭнэ системийн үндэс нь та тодорхой бүтээгдэхүүн, тодорхой хэрэглэгчийн хэрэгцээ, бүрэн CI/CD шугамтай байх ёстой. Elvis нь бодит B2B SaaS бүтээгдэхүүн хийж байгаа, хэрэглэгчид, орлого, үйлдвэрлэлийн орчинтой. Хэрэв та одоогоор Demo бичиж байгаа эсвэл суралцаж байгаа бол, энэ архитектурын ROI нь төдийлөн ашигтай биш байж магадгүй.\n\nМөн OpenClaw-ийн одоогийн аюулгүй байдлын асуудалд анхаарах хэрэгтэй. Нээлттэй мэдээллээр, хэд хэдэн өндөр аюултай CVE илэрсэн бөгөөд 341 муу санаатай нийгмийн плагин нь мэдээлэл хулгайлах үйлдэлтэй гэж олдсон. OpenClaw-ыг байрлуулахдаа, тусгаарлалт болон эрхийн хяналтыг сайн хийх хэрэгтэй. Энэ нь надад OpenClaw-ыг үндсэн машин дээрээ байрлуулахгүй байгаа шалтгаан юм.\n\nМөн нэг зүйл, Elvis твитэнд Claude Code-ийн кодын хяналтын үнэлгээг бага гэж үзсэн боловч саяхан Claude Code Agent Teams функц (албан ёсны доторх олон Agent хамтын ажиллагаа) гаргасан бөгөөд Anthropic ч энэ чиглэлд анхаарал хандуулж байна.\n\nГэхдээ эдгээр нарийн ширийн зүйлийг орхивол, Elvis-ийн энэ зохион байгуулалтын давхарга ба гүйцэтгэх давхаргын архитектурын санаа үнэхээр анхаарал татахуйц. Контекстын цонхны тэгшитгэл нь бодитойгоор оршиж байгаа хязгаарлалт бөгөөд давхарга бүхий архитектурыг ашиглан энэ асуудлыг шийдэх, янз бүрийн AI-ийг өөрийн үүрэгт ажиллуулах нь миний хувьд зөв чиглэл гэж бодож байна....

