OpenClaw + Claude Code/Codex：Membangunkan Agen Swarm Pembangunan Peribadi

Hai semua, saya adalah Lu Gong.

Baru-baru ini saya melihat satu tweet di X yang segera menarik perhatian saya. Seorang pemaju bebas bernama Elvis berkata bahawa dia kini tidak lagi menggunakan Claude Code dan Codex secara langsung, tetapi menggunakan OpenClaw sebagai lapisan pengaturcaraan, membenarkan AI pengatur bernama Zoe untuk menguruskan keseluruhan Agen Swarm Claude Code dan Codex.

Data dari tweet ini juga sangat mengagumkan, 4.9 juta paparan, 11 ribu suka, 1800 retweet.

Kami telah menulis Vibe Coding selama lebih dari empat bulan, Claude Code sentiasa menjadi alat utama. Saya juga pernah menulis beberapa artikel mengenai kerjasama multi-Agen, seni bina multi-Agen VSCode dan sebagainya.

Tetapi setelah melihat cara Elvis beroperasi, saya hanya boleh memanggilnya pakar. Seorang diri, dengan satu sistem pengaturcaraan, melakukan purata 50 penghantaran kod sehari, pada hari paling hebat menghantar 94 kali, dan juga menerima 3 panggilan pelanggan, tanpa pernah membuka editor.

Bukankah ini seperti seorang diri berfungsi sebagai satu pasukan pembangunan?

Hari ini, artikel ini akan membongkar bagaimana dia melakukannya.

OpenClaw tidak asing lagi bagi semua

Ketam kecil ini telah menjadi popular sejak sebelum Tahun Baru. Secara ringkas, ia adalah rangka kerja AI Agen sumber terbuka, yang kini telah melebihi 240,000 bintang di GitHub, dan baru-baru ini secara rasmi mengatasi React, menjadi projek sumber terbuka dengan pertumbuhan bintang terpantas dalam sejarah GitHub.

Pengasas Peter Steinberger adalah pemaju dari Austria, sebelum ini mengasaskan PSPDFKit (sebuah syarikat B2B rangka kerja PDF), dan pada tahun 2021 menerima pelaburan 100 juta euro dari Insight Partners. Pada bulan Februari tahun ini, Peter mengumumkan penyertaan dalam OpenAI, dan projek OpenClaw diserahkan kepada yayasan sumber terbuka untuk diuruskan.

OpenClaw bukanlah chatbot, tetapi runtime AI Agen yang berjalan di peranti tempatan anda. Ia mempunyai empat komponen utama: Gateway (gerbang, menyambungkan lebih dari 50 platform mesej), Agent (enjin inferens), Skills (lebih dari 5400 plugin), Memory (sistem memori).

Tetapi cara Elvis menggunakan OpenClaw agak istimewa. Dia menganggapnya sebagai lapisan pengaturcaraan, khusus untuk menguruskan Agen pengkodan seperti Claude Code dan Codex, tanpa menggunakannya sebagai pembantu umum.

Pemikiran ini memang luar biasa.

Mengapa memerlukan lapisan pengaturcaraan?

Elvis menyebut satu pandangan penting dalam tweetnya: Tetingkap konteks adalah permainan sifar-sum.

Jika anda memasukkan kod ke dalamnya, tiada ruang untuk konteks perniagaan. Jika anda memasukkan sejarah pelanggan dan catatan mesyuarat, tiada ruang untuk repositori kod. Walaupun AI tunggal sangat kuat, ia tidak dapat menyimpan dua jenis maklumat yang sangat berbeza pada masa yang sama.

Oleh itu, dia membahagikan sistem kepada dua lapisan.

Lapisan atas adalah pengatur OpenClaw, Zoe, yang menguasai semua konteks perniagaan, termasuk data pelanggan, catatan mesyuarat, keputusan sejarah, dan apa yang telah dicuba dan gagal. Semua maklumat ini disimpan dalam repositori nota Obsidian Elvis, dan Zoe boleh membacanya secara langsung.

Lapisan bawah adalah Agen pengkodan seperti Claude Code dan Codex, yang hanya melihat kod dan bertanggungjawab untuk menulis kod. Setiap kali Agen diaktifkan, Zoe akan menulis prompt yang tepat berdasarkan konteks perniagaan untuk memberitahu apa yang perlu dilakukan, latar belakangnya, dan apa yang diinginkan pelanggan.

Secara ringkas: pengatur bertanggungjawab untuk memahami keperluan, Agen pengkodan bertanggungjawab untuk bekerja. Masing-masing melakukan apa yang mereka mahir.

Reka bentuk ini serupa dengan sistem dalaman Minions yang diumumkan oleh Stripe baru-baru ini. Minions Stripe juga merupakan reka bentuk Agen pengkodan selari dengan lapisan pengaturcaraan terpusat, mampu menggabungkan lebih dari 1000 PR yang sepenuhnya ditulis oleh AI setiap minggu. Elvis berkata dia secara tidak sengaja membina struktur yang serupa, hanya berfungsi di Mac mini miliknya.

Aliran kerja kes sebenar

Elvis menggunakan satu kes sebenar dalam tweetnya untuk menerangkan aliran kerja lengkapnya, saya akan menyusun langkah-langkah utama dengan ringkas.Dia menerima panggilan dari seorang pelanggan, pelanggan ingin menggunakan konfigurasi yang sudah ada dalam pasukan. Setelah panggilan berakhir, dia berbincang dengan Zoe mengenai keperluan ini. Oleh kerana semua catatan mesyuarat akan diselaraskan secara automatik ke Obsidian, Zoe sudah tahu apa yang dikatakan oleh pelanggan, jadi tidak perlu Elvis menjelaskan lagi. Mereka bersama-sama menentukan skop fungsi, dan penyelesaian akhir adalah untuk membuat sistem templat.

Kemudian Zoe secara automatik melakukan tiga perkara: menambah kredit untuk perkhidmatan pembukaan kepada pelanggan (dia mempunyai hak API pentadbir), menarik konfigurasi sedia ada pelanggan dari pangkalan data pengeluaran (hak baca sahaja, kod Agent tidak akan pernah mempunyai hak ini), dan kemudian menghasilkan Codex Agent, lengkap dengan prompt terperinci yang mengandungi konteks perniagaan yang lengkap.

Setiap Agent mempunyai worktree (cabang terasing) dan sesi tmux yang berasingan. Arahan untuk memulakan adalah lebih kurang seperti ini:

# Buat worktree + jalankan agent git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high Setelah Agent berjalan, terdapat tugas penjadualan yang memeriksa setiap 10 minit. Tetapi ia tidak akan bertanya secara langsung kepada Agent (itu akan membakar token terlalu banyak), tetapi menjalankan skrip Shell yang deterministik, memeriksa sama ada sesi tmux masih hidup, sama ada PR telah dibuat, dan sama ada CI telah lulus.

Jika CI gagal, Agent akan dimulakan semula secara automatik, dengan maksimum 3 percubaan. Hanya apabila memerlukan campur tangan manusia barulah notifikasi dihantar.

Setelah Agent menyelesaikan tugas, PR akan dibuat secara automatik. Tetapi hanya membuat PR tidak mencukupi, Elvis telah menetapkan satu set standard penyelesaian: PR dibuat, cabang diselaraskan ke main (tanpa konflik penggabungan), CI lulus sepenuhnya, semua ulasan kod dari tiga model AI lulus, dan jika terdapat perubahan UI, tangkapan skrin mesti dilampirkan.

Tiga Model AI untuk Ulasan Kod

Tiga model AI untuk ulasan kod kelihatan sangat stabil. Mari kita bincangkan penilaian dia terhadap ketiga-tiga model ini, ia sangat menarik.

Codex Reviewer, dia memberikan penilaian tertinggi, mengatakan bahawa ulasannya sangat menyeluruh dalam situasi sempadan dan kesalahan logik, kadar positif palsu sangat rendah.

Gemini Code Assist Reviewer, percuma, dia mengatakan sangat berguna, dapat mengesan risiko keselamatan dan masalah kebolehkembangan yang terlepas oleh model lain, dan juga dapat memberikan cadangan pembaikan yang spesifik.

Claude Code Reviewer, kata-katanya adalah "hampir tidak berguna", dia mengatakan ia terlalu berhati-hati, penuh dengan cadangan seperti "pertimbangkan untuk menambah...", kebanyakan adalah reka bentuk berlebihan. Kecuali ditandakan sebagai isu kritikal, dia terus melangkau.

Saya terkejut ketika membaca bahagian ini. Sebagai pengguna berat Claude Code, saya juga telah mengalami situasi di mana ia terlalu konservatif dalam ulasan kod, tetapi penilaian "hampir tidak berguna" itu agak berlebihan. Namun, ini juga menunjukkan bahawa ulasan silang antara model memang mempunyai nilai, prejudis dari model yang berbeza saling melengkapi.

Setelah semua ulasan lulus, barulah Elvis akan menerima notifikasi Telegram. Pada tahap ini, dia lebih melihat tangkapan skrin, memastikan perubahan UI adalah betul, banyak PR yang dia tidak melihat kodnya dan terus menggabungkannya. Dia mengatakan bahawa ulasan manualnya hanya memerlukan 5 hingga 10 minit.

Proaktifnya Zoe

Zoe bukan hanya pelaksana. Lebih menarik daripada aliran kerja itu sendiri adalah proaktifnya Zoe.

Elvis mengatakan Zoe tidak akan menunggu untuk diberikan tugas, dia akan secara proaktif mencari kerja. Pagi-pagi memeriksa log kesalahan Sentry, mendapati 4 kesalahan baru, secara automatik menghasilkan 4 Agent untuk membetulkannya. Setelah mesyuarat, dia memeriksa catatan mesyuarat, menandakan 3 keperluan fungsi yang disebut oleh pelanggan, dan kemudian secara automatik memulakan 3 Codex Agent. Malamnya, dia memeriksa log Git, memulakan Claude Code untuk mengemas kini changelog dan dokumen pelanggan.

Elvis keluar untuk berjalan-jalan dan kembali, di Telegram terdapat satu mesej: 7 PR sudah siap, 3 fungsi baru, 4 pembetulan bug. Bukankah ini yang saya harapkan untuk membina kesan pasukan pembangunan syarikat satu orang OPC?Dan apabila Agent gagal, cara Zoe menangani situasi tersebut jauh lebih canggih daripada sekadar mencuba semula. Ia akan menganalisis sebab-sebab kegagalan dengan menggabungkan konteks perniagaan. Jika konteks Agent terjejas? Ia akan mengecilkan skop, membenarkan Agent hanya memberi tumpuan kepada tiga fail. Jika arah Agent tersasar? Ia juga akan membetulkan, memberitahu Agent bahawa pelanggan mahukan X dan bukan Y, serta menyertakan kata-kata asal dari mesyuarat.

Seiring berjalannya waktu, Zoe juga akan mengumpul pengalaman, mengingat struktur prompt mana yang berkesan untuk jenis tugas tertentu, dan menulis prompt yang lebih tepat pada masa akan datang.

Idea ini sebenarnya adalah versi peningkatan Ralph Loop. Logik teras Ralph Loop adalah menarik konteks, menghasilkan output, menilai hasil, dan menyimpan pengalaman dalam satu kitaran, tetapi kebanyakan pelaksanaan menggunakan prompt tetap untuk setiap kitaran. Sistem Elvis berbeza, setiap kali mencuba semula, Zoe akan menyesuaikan prompt secara dinamik berdasarkan sebab kegagalan, dan ia dilengkapi dengan konteks perniagaan yang lengkap.

Kos dan Perkakasan

Dari segi kos, data yang didedahkan oleh Elvis menunjukkan bahawa Claude berharga sekitar 100 dolar sebulan, manakala Codex berharga sekitar 90 dolar sebulan. Dia juga menyatakan, anda boleh mula mencuba dengan 20 dolar.

Kos ini tentunya jauh lebih murah berbanding menggaji seorang pemaju. Tetapi jika anda mempertimbangkan bahawa anda juga perlu membuat keputusan produk, berkomunikasi dengan pelanggan, dan menyemak kod, ia lebih mirip sebagai pengganda kecekapan, membantu anda menjimatkan masa dalam pengkodan dan pengujian yang merupakan langkah yang paling berulang.

Dari segi perkakasan, Elvis menyebut bahawa halangan terbesar yang dihadapinya adalah RAM. Setiap Agent memerlukan worktree yang berasingan, setiap worktree mempunyai nodemodules sendiri, dan setiap Agent perlu menjalankan pembinaan, pemeriksaan jenis, dan ujian. Lima Agent yang berjalan serentak bermakna lima penyusun TypeScript yang berjalan secara selari, lima pelari ujian, dan lima set kebergantungan.

Mac mini 16GB miliknya hanya dapat menjalankan 4 hingga 5 Agent pada satu masa, lebih dari itu akan mula menggunakan swap memori. Oleh itu, dia membeli Mac Studio M4 Max dengan 128GB RAM (3500 dolar), dengan harapan dapat menampung lebih banyak Agent yang berjalan serentak.

Kesimpulan dan Masalah Realiti

Secara jujur, sistem Elvis ini memberi impak yang besar kepada saya. Sebelum ini, saya selalu menganggap OpenClaw sebagai mainan, dan dalam membina produktiviti, saya bergantung kepada Claude Code yang berdiri sendiri. Kadang-kadang menggunakan worktree untuk paralel, tetapi tidak sampai ke tahap penyusunan sistematik seperti ini. Selepas membaca tweetnya, saya merasakan bahawa had dalam pengaturcaraan AI telah meningkat lagi.

Saya baru-baru ini mengikuti pemikirannya, bersedia untuk menggunakan OpenClaw untuk membina pasukan pembangunan automatik sepenuhnya. Oleh itu, dalam masa terdekat, kami akan menerbitkan beberapa artikel praktikal tentang OpenClaw.

Terdapat beberapa masalah realiti yang perlu saya ingatkan kepada semua orang.

Prasyarat untuk sistem ini adalah anda perlu mempunyai produk yang jelas, keperluan pelanggan yang tepat, dan saluran CI/CD yang lengkap. Elvis sedang membina produk B2B SaaS yang sebenar, dengan pelanggan, pendapatan, dan persekitaran pengeluaran. Jika anda masih dalam fasa menulis demo atau pembelajaran, ROI untuk struktur ini mungkin tidak berbaloi.

Selain itu, masalah keselamatan OpenClaw juga perlu diberi perhatian. Menurut maklumat yang didedahkan, sudah terdapat beberapa CVE berbahaya yang telah dilaporkan, dan 341 plugin komuniti yang berbahaya telah ditemui melakukan pencurian data. Apabila menyebarkan OpenClaw, pengasingan dan kawalan akses mesti dilakukan dengan baik. Ini juga merupakan sebab mengapa saya belum menyebarkan OpenClaw di mesin utama tempatan saya.

Satu lagi perkara, Elvis memberikan penilaian yang agak rendah terhadap semakan kod Claude Code dalam tweetnya, tetapi baru-baru ini Claude Code baru sahaja melancarkan fungsi Agent Teams (kolaborasi pelbagai Agent yang dibina dalam), dan Anthropic juga sedang berusaha ke arah penyusunan ini.

Namun, mengabaikan butiran ini, idea struktur penyusunan dan pelaksanaan Elvis memang patut diberi perhatian. Permainan zero-sum dalam tetingkap konteks adalah batasan yang nyata, menggunakan struktur berlapis untuk menyelesaikan masalah ini, membolehkan AI yang berbeza menjalankan tugas masing-masing, arah ini saya rasa adalah betul.[[HTMLPLACEHOLDER_0]]

OpenClaw + Claude Code/Codex：Membangunkan Agen Swarm Pembangunan Peribadi

OpenClaw + Claude Code/Codex：Membangunkan Agen Swarm Pembangunan Peribadi

OpenClaw tidak asing lagi bagi semua

Mengapa memerlukan lapisan pengaturcaraan?

Aliran kerja kes sebenar

Tiga Model AI untuk Ulasan Kod

Proaktifnya Zoe

Kos dan Perkakasan

Kesimpulan dan Masalah Realiti

You Might Also Like

Panduan Pengubahsuaian Claude Code Buddy: Cara Mendapatkan Haiwan Peliharaan Legenda Berkilau

Obsidian Melancarkan Defuddle, Meningkatkan Obsidian Web Clipper ke Tahap Baru

OpenAI Tiba-tiba Mengumumkan "Tiga dalam Satu": Penggabungan Pelayar + Pengaturcaraan + ChatGPT, Mengakui Kesilapan Tahun Lepas

2026, Jangan Paksa Diri Sendiri 'Disiplin'! Lakukan 8 Perkara Kecil Ini, Kesihatan Akan Datang Secara Semula Jadi

Ibu-ibu yang berusaha menurunkan berat badan tetapi tidak berhasil, pasti terjebak di sini

AI Browser 24小时稳定运行指南