OpenClaw + Claude Code/Codex: Kişisel Geliştirme Agent Swarm Oluşturma
OpenClaw + Claude Code/Codex: Kişisel Geliştirme Agent Swarm Oluşturma
Herkese merhaba, ben Lu Gong.
Geçenlerde X'te bir tweet gördüm, anında dikkatimi çekti. Elvis adında bağımsız bir geliştirici, artık doğrudan Claude Code ve Codex kullanmadığını, bunun yerine OpenClaw'ı bir orkestrasyon katmanı olarak kullandığını ve Zoe adında bir AI orkestratörünün tüm Claude Code ve Codex Agent Swarm'ını yönettiğini söyledi.
Bu tweetin verileri de oldukça etkileyici, 4.9 milyon görüntüleme, 11 bin beğeni, 1800 retweet.
Biz Vibe Coding'i dört aydan fazla bir süredir yazıyoruz, Claude Code her zaman ana araç oldu. Daha önce de çoklu Agent işbirliği, VSCode çoklu Agent mimarisi gibi konularda bazı makaleler yazmıştım.
Ama Elvis'in bu yöntemiyle karşılaşınca sadece profesyonelce olduğunu söyleyebilirim. Bir kişi, bir orkestrasyon sistemi ile, günde ortalama 50 kod gönderimi yapıyor, en yoğun gününde 94 kez gönderim yapmış, ayrıca 3 müşteri telefonunu yanıtlamış, editörü bir kez bile açmamış.
Bu, bir kişinin bir geliştirme ekibi gibi çalışması değil mi?
Bugün bu makalede, bunun nasıl yapıldığını inceleyeceğiz.
OpenClaw'a Aşina Olmayan Yoktur
Bu küçük yengeç, Çin Yeni Yılı'ndan bu yana oldukça popüler. Kısaca, açık kaynaklı bir AI Agent çerçevesidir, GitHub'da şu anda 240 binden fazla yıldız almış durumda ve iki gün önce React'ı geçerek GitHub tarihindeki en hızlı yıldız artışına sahip açık kaynak projesi oldu.
Kurucusu Peter Steinberger, Avusturyalı bir geliştirici, daha önce PSPDFKit (bir PDF çerçevesi için B2B şirketi) kurmuştu, 2021 yılında Insight Partners'tan 100 milyon Euro yatırım aldı. Bu yılın Şubat ayında Peter, OpenAI'ye katıldığını duyurdu ve OpenClaw projesi açık kaynak fonuna devredildi.
OpenClaw'ın konumu bir sohbet botu değil, yerel cihazınızda çalışan bir AI Agent çalışma zamanıdır. Dört ana bileşeni vardır: Gateway (50'den fazla mesaj platformunu bağlayan geçit), Agent (çıkarsama motoru), Skills (5400'den fazla eklenti), Memory (hafıza sistemi).
Ancak Elvis, OpenClaw'ı oldukça özel bir şekilde kullanıyor. Onu bir orkestrasyon katmanı olarak kullanıyor, özellikle Claude Code ve Codex gibi kodlama Agent'larını yönetmek için, onu genel bir asistan olarak kullanmıyor.
Bu düşünce gerçekten sıradışı.
Neden Bir Orkestrasyon Katmanına İhtiyacımız Var?
Elvis, tweetinde çok önemli bir noktaya değindi: Bağlam penceresi sıfır toplamlı bir oyundur.
İçine kod koyarsanız, iş bağlamı için yer kalmaz. Müşteri geçmişi ve toplantı kayıtları koyarsanız, kod deposu için yer kalmaz. Tek bir AI ne kadar güçlü olursa olsun, bu iki tamamen farklı türde bilgiyi aynı anda saklayamaz.
Bu yüzden sistemi iki katmana ayırdı.
Üst katman, OpenClaw'ın orkestratörü Zoe'dir; tüm iş bağlamını, müşteri verilerini, toplantı kayıtlarını, geçmiş kararları, hangi çözümlerin denendiğini ve hangilerinin başarısız olduğunu yönetir. Bu bilgiler tamamen Elvis'in Obsidian not kütüphanesinde bulunur ve Zoe doğrudan okuyabilir.
Alt katman ise Claude Code ve Codex gibi kodlama Agent'larıdır; bunlar sadece kodu görür, sadece kod yazar. Her Agent başlatıldığında, Zoe iş bağlamına göre ona doğru bir prompt yazar, ne yapması gerektiğini, arka planın ne olduğunu ve müşterinin ne istediğini söyler.
Kısaca: orkestratör ihtiyaçları anlamaktan sorumludur, kodlama Agent'ları ise işi yapmaktan sorumludur. Her biri kendi uzmanlık alanında çalışır.
Bu yapı, Stripe'ın yakın zamanda açıkladığı iç sistem Minions ile benzerlik gösteriyor. Stripe'ın Minions'ı da paralel kodlama Agent'ları ile merkezi bir orkestrasyon katmanı tasarımına sahiptir ve haftada 1000'den fazla tamamen AI tarafından yazılmış PR'yi birleştirebilmektedir. Elvis, bunun benzer bir yapıyı tesadüfen kurduğunu, sadece kendi Mac mini'sinde çalıştığını söyledi.
Gerçek Vaka Çalışma Akışı
Elvis, tweetinde gerçek bir vaka kullanarak tam çalışma akışını anlattı, ben de ana aşamaları basitçe sıralayayım.Elvis bir müşteri telefonunu yanıtladı, müşteri mevcut yapılandırmayı ekip içinde yeniden kullanmak istedi. Görüşme sona erdikten sonra, bu talebi Zoe ile konuştu. Tüm toplantı kayıtları otomatik olarak Obsidian'a senkronize edildiği için, Zoe müşterinin ne söylediğini zaten biliyordu, Elvis'in ek bir açıklama yapmasına gerek yoktu. Birlikte işlev kapsamını belirlediler ve nihai çözüm bir şablon sistemi oluşturmak oldu.
Sonra Zoe otomatik olarak üç şey yaptı: Müşteriye hizmeti açmak için para yükledi (yönetici API yetkisine sahip), üretim veritabanından müşterinin mevcut yapılandırmasını çekti (sadece okuma yetkisi, kodlama Agent'ının bu yetkiye asla sahip olmayacağı), ardından tam iş bağlamını içeren ayrıntılı bir prompt ile bir Codex Agent oluşturdu.
Her Agent'ın kendi bağımsız worktree'si (izole edilmiş dal) ve tmux oturumu vardır. Başlatma komutu yaklaşık olarak şöyle:
# Worktree oluştur + agent başlat git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high Agent çalışmaya başladıktan sonra, her 10 dakikada bir denetim yapan bir zamanlayıcı görevi vardır. Ancak doğrudan Agent'a sormaz (bu çok fazla token tüketir), bunun yerine belirli bir Shell betiği çalıştırır, tmux oturumunun hala aktif olup olmadığını, PR oluşturup oluşturmadığını, CI'nin geçip geçmediğini kontrol eder.
Eğer CI başarısız olursa, Agent'ı otomatik olarak yeniden başlatır, en fazla 3 kez tekrar dener. Sadece insan müdahalesi gerektiğinde bildirim gönderir.
Agent görevini tamamladıktan sonra otomatik olarak PR oluşturur. Ancak sadece PR oluşturmak yeterli değildir, Elvis bir tamamlanma standardı tanımlamıştır: PR oluşturma, dalın main'e senkronize edilmesi (birleştirme çakışması olmadan), CI'nin tamamen geçmesi, üç AI modelinin kod incelemesinin tamamen geçmesi, eğer UI değişikliği varsa ekran görüntüsü eklenmesi gerekmektedir.
Üç AI Modeli Kod İncelemesi
Üç AI modeli kod incelemesi yaparken oldukça sağlam görünüyor. Bu üç model hakkındaki değerlendirmesini konuşmak oldukça ilginç.
Codex Reviewer, en yüksek değerlendirmeyi aldı, sınır durumları ve mantık hataları açısından incelemesinin çok kapsamlı olduğunu, yanlış pozitif oranının çok düşük olduğunu söyledi.
Gemini Code Assist Reviewer, ücretsiz, çok kullanışlı olduğunu, diğer modellerin gözden kaçırdığı güvenlik açıklarını ve ölçeklenebilirlik sorunlarını tespit edebildiğini, ayrıca belirli düzeltme önerileri sunabildiğini belirtti.
Claude Code Reviewer, kendi sözleriyle "temelde işe yaramaz" dedi, aşırı temkinli olduğunu, ekranın her yerinde "eklemeyi düşünün..." gibi önerilerle dolu olduğunu, çoğu önerinin aşırı tasarım olduğunu söyledi. Kritik bir sorun olarak işaretlenmedikçe, doğrudan atladığını belirtti.
Bu kısmı okuduğumda biraz şaşırdım. Claude Code'un yoğun bir kullanıcısı olarak, kod incelemesi sırasında aşırı temkinli olduğu durumlarla karşılaştım, ancak "temelde işe yaramaz" değerlendirmesi biraz fazla. Ancak bu, çoklu model çapraz incelemenin gerçekten değerli olduğunu, farklı modellerin önyargılarının birbirini tamamladığını gösteriyor.
Üç inceleme de geçtikten sonra, Elvis ancak Telegram bildirimini alır. Bu aşamada, esas olarak ekran görüntülerine bakar, UI değişikliklerinin doğru olup olmadığını onaylar, birçok PR'ı kodu incelemeden doğrudan birleştirir. Kendi manuel incelemesinin sadece 5 ila 10 dakika sürdüğünü söyler.
Zoe'nin Proaktifliği
Zoe sadece bir uygulayıcı değildir. İş akışının kendisinden daha ilginç olan, Zoe'nin proaktifliğidir.
Elvis, Zoe'nin kendisine görev verilmesini beklemediğini, aktif olarak iş bulduğunu söyledi. Sabah Sentry'nin hata günlüklerini tarar, 4 yeni hata bulur, otomatik olarak 4 Agent oluşturur. Toplantıdan sonra toplantı kayıtlarını tarar, müşterinin bahsettiği 3 işlev talebini işaretler, ardından otomatik olarak 3 Codex Agent başlatır. Akşam Git günlüklerini tarar, Claude Code'u güncelleyerek changelog ve müşteri belgelerini başlatır.
Elvis dışarıda kısa bir yürüyüşe çıktığında, Telegram'da 7 PR'ın hazır olduğu, 3 yeni işlev, 4 hata düzeltmesi içeren bir mesaj bulur. Bu, benim her zaman oluşturmayı umduğum OPC tek kişilik şirket geliştirme ekibi etkisi değil mi?Ayrıca, Agent başarısız olduğunda, Zoe'nin işleme şekli basit bir yeniden denemeden çok daha gelişmiştir. Başarısızlık nedenini iş bağlamıyla birleştirerek analiz eder. Agent bağlamı patladı mı? Kapsamı daraltır, Agent'ın yalnızca üç dosyaya odaklanmasını sağlar. Agent yönü kaybetti mi? Düzeltir, Agent'a müşterinin X istediğini, Y değil, ve toplantıdaki orijinal sözleri ekler.
Zamanla, Zoe deneyim biriktirir, hangi prompt yapısının hangi tür görevlerde iyi sonuç verdiğini hatırlar ve bir sonraki sefer daha kesin bir prompt yazar.
Bu düşünce aslında Ralph Loop'un bir üst versiyonudur. Ralph Loop'un temel mantığı bağlamı çekmek, çıktı üretmek, sonuçları değerlendirmek ve deneyimi kaydetmek gibi bir döngüdür, ancak çoğu uygulama her döngü için sabit bir prompt kullanır. Elvis'in sistemi farklıdır, her yeniden denemede Zoe başarısızlık nedenine göre dinamik olarak prompt'u ayarlar ve tam bir iş bağlamı ile desteklenir.
Maliyet ve Donanım
Maliyet açısından, Elvis'in açıkladığı verilere göre Claude aylık yaklaşık 100 dolar, Codex ise aylık yaklaşık 90 dolardır. Ayrıca, başlangıçta 20 dolardan denemeye başlayabileceğini de belirtti.
Bu maliyet, bir geliştirici istihdam etmekle karşılaştırıldığında elbette çok daha ucuzdur. Ancak, kendi ürün kararlarını, müşteri iletişimini ve kod incelemesini yapmanız gerektiğini düşündüğünüzde, bu daha çok bir verimlilik artırıcı gibi, kodlama ve test gibi en tekrarlayıcı aşamaları ortadan kaldırmanıza yardımcı olur.
Donanım açısından, Elvis şu anda en büyük darboğazının RAM olduğunu belirtti. Her Agent'ın bağımsız bir worktree'ye ihtiyacı var, her worktree'nin kendi nodemodules'u var, her Agent inşa, tür kontrolü ve test çalıştırmak zorunda. 5 Agent aynı anda çalıştığında, bu 5 paralel TypeScript derleyicisi, 5 test çalıştırıcısı ve 5 set bağımlılık anlamına gelir.
Onun Mac mini 16GB RAM ile en fazla 4-5 Agent'ı aynı anda çalıştırabiliyor, daha fazlası başladığında bellek takasına geçiyor. Bu yüzden 128GB RAM'li bir Mac Studio M4 Max (3500 dolar) satın aldı ve daha fazla Agent eşzamanlılığını desteklemek için bunu kullanmayı planlıyor.
Özet ve Gerçek Problemler
Açıkçası, Elvis'in bu sistemi benim için oldukça etkileyici oldu. Daha önce OpenClaw'ı bir oyuncak olarak görüyordum, üretkenlik oluşturma konusunda bağımsız Claude Code'a güveniyordum. Ara sıra worktree kullanarak paralel çalışıyordum, ancak bu sistematik düzenleme seviyesine ulaşmamıştım. Onun tweet'lerini okuduktan sonra, AI programlamanın sınırlarının bir kez daha yükseldiğini düşünüyorum.
Son zamanlarda onun düşüncelerine göre, OpenClaw ile tamamen otomatik bir tek kişilik geliştirme ekibi kurmayı planlıyorum. Bu yüzden, yakın zamanda OpenClaw ile ilgili birçok uygulama makalesi yayınlayacağız.
Herkese hatırlatmam gereken birkaç gerçek sorun var.
Bu sistemin ön koşulu, net bir ürün, belirgin müşteri ihtiyaçları ve sağlam bir CI/CD hattına sahip olmanızdır. Elvis, gerçek bir B2B SaaS ürünü yapıyor, müşterileri, geliri ve üretim ortamı var. Eğer hala Demo yazıyorsanız veya öğrenme aşamasındaysanız, bu mimarinin ROI'si pek mantıklı olmayabilir.
Ayrıca, OpenClaw'ın mevcut güvenlik sorunlarına da dikkat etmek gerekiyor. Kamuya açık bilgilere göre, birçok yüksek riskli CVE ifşa edildi ve 341 kötü niyetli topluluk eklentisinin veri hırsızlığı yaptığı tespit edildi. OpenClaw'ı dağıtırken, izolasyon ve izin kontrolünü iyi yapmalısınız. Bu da benim OpenClaw'ı ana bilgisayarımda dağıtmamamın nedenlerinden biridir.
Bir diğer nokta, Elvis'in tweet'inde Claude Code'un kod incelemesine düşük bir değerlendirme verdi, ancak son zamanlarda Claude Code, Agent Teams özelliğini (resmi olarak entegre çoklu Agent işbirliği) tanıttı ve Anthropic bu yönde çalışmalara devam ediyor.
Ancak bu detayları bir kenara bırakırsak, Elvis'in bu düzenleme katmanı ve yürütme katmanı mimarisi gerçekten dikkate değer. Bağlam penceresinin sıfır toplamlı oyunu gerçek bir kısıtlama olarak mevcuttur, bu sorunu çözmek için katmanlı bir mimari kullanmak, farklı AI'ların kendi görevlerini yerine getirmesini sağlamak, bu yönde doğru bir yaklaşım olduğunu düşünüyorum.[[HTMLPLACEHOLDER_0]]

