OpenClaw + Claude Code/Codex：व्यक्तिगत विकास एजंट स्वार्म तयार करणे

सर्वांना नमस्कार, मी लूगोंग आहे.

अलीकडेच X वर एक ट्वीट पाहिले, ज्याने मला त्वरित आकर्षित केले. एक स्वतंत्र विकासक, एल्विस, म्हणाला की तो आता थेट Claude Code आणि Codex वापरत नाही, तर OpenClaw ला एक समन्वय स्तर म्हणून वापरतो, ज्यामुळे एक AI समन्वयक, Zoe, संपूर्ण Claude Code आणि Codex च्या एजंट स्वार्मचे व्यवस्थापन करते.

या ट्वीटच्या डेटानेही धक्का दिला, 4900000 दृश्ये, 11000 आवडी, 1800 पुनःप्रसारण.

आम्ही Vibe Coding वर चार महिन्यांहून अधिक काळ लेखन करत आहोत, Claude Code नेहमीच मुख्य साधन राहिले आहे. मी पूर्वीच काही मल्टी-एजंट सहकार्य, VSCode मल्टी-एजंट आर्किटेक्चर इत्यादी संबंधित लेख लिहिले आहेत.

परंतु एल्विसच्या या पद्धतीने पाहिल्यावर, मला फक्त तज्ञ म्हणून बोलावे लागले. एक व्यक्ती, एक समन्वय प्रणालीच्या आधारे, दररोज 50 वेळा कोड सबमिट करते, सर्वात जोरदार दिवशी 94 वेळा सबमिट केले, आणि 3 ग्राहकांचे फोन कॉल घेतले, संपादक एकदाही उघडला नाही.

हे एक व्यक्ती एक विकास टीम म्हणून वापरण्यासारखे नाही का?

आजचा हा लेख त्याने हे कसे केले याचे विश्लेषण करेल.

OpenClaw सर्वांना परिचित आहे

ही लहान झुंगी सणाच्या आधीपासूनच लोकप्रिय आहे. साध्या भाषेत सांगायचे झाले तर, हे एक ओपन-सोर्स AI एजंट फ्रेमवर्क आहे, GitHub वर सध्या 240,000 पेक्षा जास्त स्टार आहेत, आणि दोन दिवसांपूर्वी React च्या आधीच गेले, GitHub च्या इतिहासातील स्टार वाढीचा सर्वात जलद ओपन-सोर्स प्रकल्प बनला.

संस्थापक पीटर स्टाइनबर्गर ऑस्ट्रियाचा विकासक आहे, त्याने पूर्वी PSPDFKit (PDF फ्रेमवर्कचा B2B कंपनी) स्थापन केला होता, 2021 मध्ये Insight Partners कडून 1 कोटी युरोची गुंतवणूक मिळवली. या वर्षी फेब्रुवारीत पीटरने OpenAI मध्ये सामील होण्याची घोषणा केली, OpenClaw प्रकल्प ओपन-सोर्स फाउंडेशनच्या व्यवस्थापनात हस्तांतरित केला.

OpenClaw ची定位 चॅटबॉट नाही, तर हे तुमच्या स्थानिक उपकरणावर चालणारे AI एजंट रनटाइम आहे. यामध्ये चार मुख्य घटक आहेत: Gateway (गेटवे, 50 पेक्षा जास्त संदेश प्लॅटफॉर्म कनेक्ट करणे), Agent (इनफरन्स इंजिन), Skills (5400 पेक्षा जास्त प्लगइन), Memory (स्मृती प्रणाली).

परंतु एल्विस OpenClaw चा वापर करण्याची पद्धत विशेष आहे. त्याने ते थेट समन्वय स्तर म्हणून घेतले, विशेषतः Claude Code आणि Codex या कोडिंग एजंटचे व्यवस्थापन करण्यासाठी, त्याला सामान्य सहाय्यक म्हणून वापरण्याचा विचार केला नाही.

ही विचारधारा खरोखरच असामान्य आहे.

समन्वय स्तराची आवश्यकता का आहे?

एल्विसने ट्वीटमध्ये एक महत्त्वाचा मुद्दा उपस्थित केला: संदर्भ विंडो शून्य-एक खेळ आहे.

तुम्ही त्यात कोड भरला, तर व्यवसाय संदर्भ ठेवण्यासाठी जागा नाही. तुम्ही ग्राहकांचा इतिहास आणि बैठकींची नोंद भरली, तर कोड बेस ठेवण्यासाठी जागा नाही. एकटा AI कितीही शक्तिशाली असला तरी, तो या दोन पूर्णपणे भिन्न प्रकारच्या माहिती एकाच वेळी ठेवू शकत नाही.

म्हणून त्याने प्रणाली दोन स्तरांमध्ये विभाजित केली.

वरचा स्तर म्हणजे OpenClaw चा समन्वयक Zoe, ती सर्व व्यवसाय संदर्भ समजून घेते, ज्यामध्ये ग्राहक डेटा, बैठकींची नोंद, ऐतिहासिक निर्णय, कोणत्या योजना प्रयत्न केल्या, कोणत्या अपयशी झाल्या. ही सर्व माहिती एल्विसच्या Obsidian नोट्समध्ये आहे, Zoe थेट वाचू शकते.

खालचा स्तर म्हणजे Claude Code आणि Codex या कोडिंग एजंट, ते फक्त कोड पाहतात, फक्त कोड लिहितात. प्रत्येक एजंट सुरू होताना, Zoe व्यवसाय संदर्भानुसार त्याला एक अचूक प्रॉम्प्ट लिहिते, त्याला काय करायचे आहे, पार्श्वभूमी काय आहे, ग्राहकाला काय हवे आहे हे सांगते.

साध्या भाषेत सांगायचे झाले तर: समन्वयक आवश्यकतांचे समजून घेण्यास जबाबदार आहे, कोडिंग एजंट काम करण्यास जबाबदार आहे. प्रत्येकजण त्यांच्या कौशल्यात कार्य करतो.

हे आर्किटेक्चर Stripe ने काही काळापूर्वी सार्वजनिक केलेल्या अंतर्गत प्रणाली Minions च्या समान आहे. Stripe च्या Minions देखील समांतर कोडिंग एजंट आणि केंद्रीकृत समन्वय स्तराची रचना आहे, प्रत्येक आठवड्यात 1000 पेक्षा जास्त पूर्णपणे AI द्वारे लिहिलेल्या PR एकत्रित करू शकतात. एल्विस म्हणतो की त्याने अनायासे एक समान आर्किटेक्चर तयार केले, फक्त त्याच्या Mac mini वर चालत आहे.

वास्तविक प्रकरण कार्यप्रवाह

एल्विसने ट्वीटमध्ये एक वास्तविक प्रकरण वापरले आहे ज्यामध्ये त्याच्या संपूर्ण कार्यप्रवाहाचे वर्णन केले आहे, मी मुख्य टप्पे साध्या भाषेत सांगतो.त्याने एक ग्राहक फोन उचलला, ग्राहकाला टीममध्ये आधीच असलेल्या कॉन्फिगरेशनचा पुनर्वापर करायचा होता. कॉल संपल्यानंतर, त्याने झोईसोबत या गरजेबद्दल चर्चा केली. कारण सर्व बैठकांचे रेकॉर्ड ऑटोमॅटिकली ओब्सिडियनमध्ये समक्रमित केले जातात, झोईला ग्राहकाने काय सांगितले हे आधीच माहित होते, एल्विसला अतिरिक्त स्पष्टीकरण देण्याची आवश्यकता नव्हती. त्यांनी एकत्रितपणे कार्यक्षेत्र निश्चित केले, अंतिम योजना म्हणजे एक टेम्पलेट सिस्टम तयार करणे.

त्यानंतर झोईने तीन गोष्टी स्वयंचलितपणे केल्या: ग्राहकाला अनलॉक सेवा रिचार्ज करणे (तिला प्रशासक API परवानगी आहे), उत्पादन डेटाबेसमधून ग्राहकाचे विद्यमान कॉन्फिगरेशन आणणे (फक्त वाचन परवानगी, कोडिंग एजंटला कधीही ही परवानगी मिळणार नाही), आणि नंतर एक कोडेक्स एजंट तयार करणे, ज्यामध्ये संपूर्ण व्यवसाय संदर्भासह तपशीलवार प्रॉम्प्ट समाविष्ट आहे.

प्रत्येक एजंटचा स्वतःचा स्वतंत्र कार्यवृक्ष (आइसोलेशन ब्रांच) आणि tmux सत्र आहे. प्रारंभ आदेश साधारणपणे असा आहे:

# कार्यवृक्ष तयार करा + एजंट सुरू करा git worktree add ../feat-custom-templates -b feat/custom-templates origin/main cd ../feat-custom-templates && pnpm install tmux new-session -d -s "codex-templates" \ -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \ "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high एजंट चालू झाल्यानंतर, एक वेळापत्रक कार्य प्रत्येक 10 मिनिटांनी तपासणी करते. पण ते थेट एजंटला विचारत नाही (तसे केल्यास टोकन जास्त वापरले जातील), तर एक निश्चित शेल स्क्रिप्ट चालवते, tmux सत्र अजूनही जिवंत आहे का, PR तयार केला आहे का, CI पास झाला आहे का हे तपासते.

जर CI अयशस्वी झाला, तर एजंट स्वयंचलितपणे पुनःप्रारंभ होतो, जास्तीत जास्त 3 वेळा पुन्हा प्रयत्न करतो. फक्त मानवी हस्तक्षेपाची आवश्यकता असताना सूचना पाठवली जाते.

एजंट कार्य पूर्ण झाल्यानंतर स्वयंचलितपणे PR तयार करतो. पण फक्त PR तयार करणे पुरेसे नाही, एल्विसने पूर्ण करण्याचे मानक निश्चित केले: PR तयार करणे, शाखा मुख्यात समक्रमित करणे (कोणतीही विलीन संघर्ष नाही), CI सर्व पास करणे, तीन AI मॉडेल्सच्या कोड पुनरावलोकन सर्व पास करणे, जर UI मध्ये बदल असेल तर स्क्रीनशॉट जोडणे आवश्यक आहे.

तीन AI मॉडेल्स कोड पुनरावलोकन करतात

तीन AI मॉडेल्स कोड पुनरावलोकन करताना खूप स्थिर दिसतात. त्याने या तीन मॉडेल्सबद्दलचे त्याचे मूल्यांकन थोडक्यात सांगितले, ते खूपच मनोरंजक आहे.

कोडेक्स पुनरावलोकक, त्याने सर्वात जास्त मूल्यांकन केले, तो म्हणाला की सीमारेषा परिस्थिती आणि तर्कशुद्ध चुका याबाबतचे पुनरावलोकन अत्यंत सखोल आहे, चुकांची दर कमी आहे.

जेमिनी कोड सहाय्यक पुनरावलोकक, मोफत, तो म्हणाला की अत्यंत उपयुक्त आहे, इतर मॉडेल्सने गहाळ केलेल्या सुरक्षा धोक्यांचा आणि विस्तारणीयतेच्या समस्यांचा शोध घेऊ शकतो, तसेच विशिष्ट दुरुस्ती योजना देऊ शकतो.

क्लॉड कोड पुनरावलोकक, त्याचे शब्द आहेत "मुळात उपयोगी नाही", तो म्हणाला की ते अत्यधिक काळजी घेतात, पूर्ण स्क्रीनवर "वाढविण्याचा विचार करा..." सारख्या शिफारसींनी भरलेले आहे, बहुतेक अति डिझाइनमध्ये आहेत. महत्त्वाच्या समस्यांवर चिन्हांकित केले नाही तर तो थेट उडी मारतो.

मी या भागात पाहताना थोडा आश्चर्यचकित झालो. क्लॉड कोडचा प्रचंड वापरकर्ता म्हणून, मी खरोखरच त्याच्या कोड पुनरावलोकन करताना अत्यधिक सावधगिरीच्या परिस्थितीचा सामना केला आहे, पण "मुळात उपयोगी नाही" हा मूल्यांकन थोडा कठोर आहे. पण हे देखील एक प्रकारे दर्शवते की, बहु-मॉडेल क्रॉस पुनरावलोकन खरोखरच मूल्यवान आहे, विविध मॉडेल्सच्या पूर्वग्रह एकमेकांना पूरक आहेत.

तीन पुनरावलोकन सर्व पास झाल्यावर, एल्विसला फक्त टेलीग्राम सूचना मिळेल. या टप्प्यावर, तो मुख्यतः स्क्रीनशॉट पाहतो, UI बदल योग्य आहे का ते पुष्टी करतो, अनेक PR तो कोड न पाहता थेट विलीन करतो. तो म्हणतो की त्याचे मानवी पुनरावलोकन फक्त 5 ते 10 मिनिटे लागते.

झोईची सक्रियता

झोई फक्त कार्यान्वयन करणारी नाही. कार्यप्रवाहापेक्षा अधिक मनोरंजक म्हणजे झोईची सक्रियता.

एल्विस म्हणतो की झोई कार्ये वाटपाची वाट पाहत नाही, ती सक्रियपणे काम शोधते. सकाळी Sentry च्या त्रुटी लॉग स्कॅन करते, 4 नवीन त्रुटी शोधते, 4 एजंट स्वयंचलितपणे तयार करते. बैठक संपल्यानंतर बैठकांचे रेकॉर्ड स्कॅन करते, ग्राहकाने उल्लेख केलेल्या 3 कार्यात्मक गरजा चिन्हांकित करते, आणि नंतर 3 कोडेक्स एजंट स्वयंचलितपणे सुरू करते. संध्याकाळी Git लॉग स्कॅन करते, क्लॉड कोड चेंजेलॉग आणि ग्राहक दस्तऐवज अद्यतनित करण्यासाठी सुरू करते.

एल्विस बाहेर फिरायला जातो आणि परत येतो, टेलीग्रामवर एक संदेश आहे: 7 PR तयार आहेत, 3 नवीन कार्ये, 4 बग दुरुस्त. हेच मी नेहमीच अपेक्षीत असलेल्या OPC एक व्यक्ती कंपनी विकास टीमचा परिणाम आहे का.आणि जेव्हा एजंट अयशस्वी होतो, तेव्हा झोईची हाताळणी साध्या पुन्हा प्रयत्नांपेक्षा खूपच उच्च आहे. हे व्यवसायाच्या संदर्भात अयशस्वी होण्याचे कारण विश्लेषण करेल. एजंट संदर्भ फसला का? ते क्षेत्र कमी करेल, एजंटला फक्त तीन फाइल्सवर लक्ष केंद्रित करण्यास सांगेल. एजंटचा दिशाभूल झाला का? तेही सुधारेल, एजंटला सांगेल की ग्राहकाला X हवे आहे, Y नाही, आणि बैठकीतील मूळ शब्दांसह जोडेल.

काळाच्या ओघात, झोई अनुभव जमा करेल, कोणते प्रॉम्प्ट संरचना कोणत्या प्रकारच्या कार्यांसाठी चांगले कार्य करतात हे लक्षात ठेवेल, पुढच्या वेळी अधिक अचूक प्रॉम्प्ट तयार करेल.

हा विचार वास्तवात राल्फ लूपचा उन्नत आवृत्ती आहे. राल्फ लूपचा मुख्य तत्त्वज्ञान संदर्भ काढणे, आउटपुट तयार करणे, परिणामांचे मूल्यांकन करणे, अनुभव जतन करणे असा चक्र आहे, परंतु बहुतेक अंमलबजावणी प्रत्येक चक्रासाठी प्रॉम्प्ट निश्चित असतो. एल्विसचा प्रणाली वेगळी आहे, प्रत्येक पुन्हा प्रयत्नात झोई अयशस्वी होण्याच्या कारणानुसार प्रॉम्प्ट गतिशीलपणे समायोजित करेल, आणि संपूर्ण व्यवसाय संदर्भासह समर्थन मिळेल.

खर्च आणि हार्डवेअर

खर्चाच्या बाबतीत, एल्विसने जाहीर केलेले डेटा आहे की क्लॉड प्रत्येक महिन्यात सुमारे 100 डॉलर, कोडेक्स प्रत्येक महिन्यात सुमारे 90 डॉलर आहे. त्याने हेही सांगितले की, सुरुवात 20 डॉलरपासून करून पाहू शकता.

हा खर्च एक विकासक भाड्याने घेण्याच्या तुलनेत निश्चितच हास्यास्पदपणे कमी आहे. परंतु जर तुम्हाला तुमच्या उत्पादन निर्णय, ग्राहक संवाद, कोड पुनरावलोकन स्वतः करावे लागेल, तर हे अधिक कार्यक्षमता वाढवणारे उपकरण आहे, जे तुम्हाला कोडिंग आणि चाचणीच्या या पुनरावृत्तीच्या उच्चतम टप्प्यातून वाचवते.

हार्डवेअरच्या बाबतीत, एल्विसने त्याच्या सध्या सर्वात मोठ्या अडथळा RAM असल्याचे सांगितले. प्रत्येक एजंटला स्वतंत्र वर्कट्री आवश्यक आहे, प्रत्येक वर्कट्रीला स्वतःचे nodemodules आहेत, प्रत्येक एजंटला बांधकाम, प्रकार तपासणी आणि चाचणी चालवावी लागते. 5 एजंट एकाच वेळी चालवणे म्हणजे 5 समांतर TypeScript संकलक, 5 चाचणी चालवणारे, 5 संच अवलंबन.

त्याचा मॅक मिनी 16GB मेमरीमध्ये एकाच वेळी 4 ते 5 एजंट चालवू शकतो, त्यापेक्षा अधिक झाल्यास मेमरी स्वॅपिंग सुरू होते. म्हणून त्याने 128GB मेमरीचा मॅक स्टुडिओ M4 मॅक्स (3500 डॉलर) खरेदी केला, अधिक एजंट समांतर चालवण्यासाठी त्याचा वापर करण्याचा विचार केला.

सारांश आणि वास्तविक समस्या

सत्य सांगायचे झाले तर, एल्विसची ही प्रणाली मला खूप प्रभावी वाटली. मी पूर्वी ओपनक्लॉवरला खेळण्याच्या खेळणीसारखे मानले, उत्पादनक्षमतेच्या बाबतीत, मी स्वतंत्र क्लॉड कोडवर अवलंबून होतो. कधीकधी वर्कट्रीचा वापर समांतर करण्यासाठी केला, परंतु या प्रणालीकरणाच्या पातळीपर्यंत कधीच पोहोचले नाही. त्याच्या ट्वीट्सनंतर, मला वाटते की AI प्रोग्रामिंगच्या बाबतीत छत आणखी उंच झाले आहे.

मी अलीकडे त्याच्या विचारानुसार ओपनक्लॉवर वापरून पूर्णपणे स्वयंचलित एक व्यक्ती विकास टीम तयार करण्याचा विचार करीत आहे. त्यामुळे, लवकरच आमच्या हिशेबात ओपनक्लॉवरच्या कार्यान्वयनावर अनेक लेख प्रकाशित केले जातील.

काही वास्तविक समस्या लक्षात ठेवण्याची आवश्यकता आहे.

या प्रणालीचा पूर्वग्रह म्हणजे तुम्हाला एक स्पष्ट उत्पादन, स्पष्ट ग्राहक आवश्यकता, पूर्ण CI/CD पाइपलाइन असणे आवश्यक आहे. एल्विस एक वास्तविक B2B SaaS उत्पादन तयार करत आहे, ग्राहक, उत्पन्न, उत्पादन वातावरण आहे. जर तुम्ही अजूनही डेमो किंवा शिकण्याच्या टप्प्यात असाल, तर या संरचनेचा ROI कदाचित फारच फायदेशीर नसेल.

याशिवाय, ओपनक्लॉवरच्या सध्याच्या सुरक्षेच्या समस्यांवरही लक्ष देणे आवश्यक आहे. जाहीर माहितीच्या आधारे, अनेक उच्च धोका CVE उघडकीस आले आहेत, आणि 341 मालिशी समुदाय प्लगइनमध्ये डेटा चोरण्याचे वर्तन आढळले आहे. ओपनक्लॉवर तैनात करताना, पृथक्करण आणि परवान्याचे नियंत्रण चांगले करणे आवश्यक आहे. हे देखील मी ओपनक्लॉवरला स्थानिक मुख्य मशीनवर तैनात केले नाही याचे कारण आहे.

आणखी एक गोष्ट, एल्विसने ट्वीटमध्ये क्लॉड कोडच्या कोड पुनरावलोकनाचे मूल्यांकन कमी केले आहे, परंतु अलीकडेच क्लॉड कोडने एजंट टीम्स कार्यक्षमता (आधिकारिक अंतर्गत बहु-एजंट सहकार्य) सुरू केले आहे, अँथ्रॉपिकही या दिशेने काम करत आहे.

तथापि, या तपशीलांपासून दूर राहून, एल्विसची ही संरचना स्तर आणि कार्यान्वयन स्तराची विचारधारा खरोखरच लक्षात घेण्यासारखी आहे. संदर्भ विंडोचा शून्य-योगात्मक खेळ खरोखर अस्तित्वात असलेला बंधन आहे, या समस्येचे निराकरण करण्यासाठी स्तरित संरचना वापरणे, विविध AI ला त्यांच्या कार्यात कार्य करण्यास अनुमती देणे, हा दिशा मला वैयक्तिकरित्या योग्य वाटतो.[[HTMLPLACEHOLDER_0]]

OpenClaw + Claude Code/Codex：व्यक्तिगत विकास एजंट स्वार्म तयार करणे

OpenClaw + Claude Code/Codex：व्यक्तिगत विकास एजंट स्वार्म तयार करणे

OpenClaw सर्वांना परिचित आहे

समन्वय स्तराची आवश्यकता का आहे?

वास्तविक प्रकरण कार्यप्रवाह

तीन AI मॉडेल्स कोड पुनरावलोकन करतात

झोईची सक्रियता

खर्च आणि हार्डवेअर

सारांश आणि वास्तविक समस्या

You Might Also Like

Claude Code Buddy सुधारणा मार्गदर्शक: कसे मिळवायचे चमकदार किंवदंती स्तराचे पाळीव प्राणी

Obsidian ने Defuddle लॉन्च केला, Obsidian Web Clipper ला एक नवीन उंचीवर नेले

2026, स्वतःला 'आत्मशिस्त' देण्याची गरज नाही! या 8 लहान गोष्टी करा, आरोग्य आपोआप येईल

त्या मेहनतीने वजन कमी करण्याचा प्रयत्न करणाऱ्या मातांना, नक्कीच इथेच अडचण येते

AI ब्राउझर 24 तास स्थिर चालवण्याची मार्गदर्शिका