OpenClaw + Claude Code/Codex:ব্যক্তিগত উন্নয়ন এজেন্ট স্বার্ম তৈরি করা
OpenClaw + Claude Code/Codex:ব্যক্তিগত উন্নয়ন এজেন্ট স্বার্ম তৈরি করা
সবাইকে স্বাগতম, আমি লু গং।
সম্প্রতি X-এ একটি টুইট দেখলাম, যা আমাকে তৎক্ষণাৎ আকৃষ্ট করল। একজন স্বাধীন ডেভেলপার এলভিস বললেন, তিনি এখন আর সরাসরি Claude Code এবং Codex ব্যবহার করছেন না, বরং OpenClaw-কে একটি অর্কেস্ট্রেশন স্তর হিসেবে ব্যবহার করছেন, যাতে একটি AI অর্কেস্ট্রেটর Zoe পুরো Claude Code এবং Codex-এর এজেন্ট স্বার্ম পরিচালনা করে।
এই টুইটের তথ্যও খুব চিত্তাকর্ষক, ৪৯০万 ভিউ, ১.১万 লাইক, ১৮০০ রিটুইট।
আমরা Vibe Coding নামে চার মাসেরও বেশি সময় ধরে লিখছি, Claude Code সবসময় প্রধান টুল ছিল। আমি আগে কিছু মাল্টি-এজেন্ট সহযোগিতা, VSCode মাল্টি-এজেন্ট আর্কিটেকচার ইত্যাদি সম্পর্কিত নিবন্ধও লিখেছি।
কিন্তু এলভিসের এই পদ্ধতি দেখে আমি শুধু অভিজ্ঞতা প্রকাশ করতে পারি। একজন ব্যক্তি, একটি অর্কেস্ট্রেশন সিস্টেমের সাহায্যে, দৈনিক ৫০ বার কোড জমা দিচ্ছে, সবচেয়ে শক্তিশালী দিনে ৯৪ বার জমা দিয়েছে, এবং ৩টি ক্লায়েন্ট কলও নিয়েছে, সম্পাদকের একবারও খোলেনি।
এটা কি একজন ব্যক্তির দ্বারা একটি উন্নয়ন দলের কাজ করার মতো নয়?
আজকের এই নিবন্ধটি বিশ্লেষণ করবে, তিনি আসলে কীভাবে এটি করেছেন।
OpenClaw সবাই পরিচিত
এই ছোট লবস্টার চীনের নববর্ষের আগে থেকে এখন পর্যন্ত খুব জনপ্রিয়। সহজভাবে বলতে গেলে, এটি একটি ওপেন সোর্স AI এজেন্ট ফ্রেমওয়ার্ক, GitHub-এ বর্তমানে ২৪০,০০০-এরও বেশি স্টার রয়েছে, এবং গত দুই দিনে এটি React-কে অতিক্রম করে GitHub-এর ইতিহাসে স্টার বৃদ্ধির সবচেয়ে দ্রুততম ওপেন সোর্স প্রকল্প হয়ে উঠেছে।
প্রতিষ্ঠাতা পিটার স্টেইনবার্গার একজন অস্ট্রিয়ান ডেভেলপার, যিনি আগে PSPDFKit (একটি PDF ফ্রেমওয়ার্কের B2B কোম্পানি) প্রতিষ্ঠা করেছিলেন, ২০২১ সালে ইনসাইট পার্টনার্স থেকে ১০ মিলিয়ন ইউরোর বিনিয়োগ পেয়েছিলেন। এই বছরের ফেব্রুয়ারিতে পিটার OpenAI-তে যোগ দেওয়ার ঘোষণা দেন, OpenClaw প্রকল্পটি ওপেন সোর্স ফাউন্ডেশনের পরিচালনার জন্য হস্তান্তর করা হয়।
OpenClaw-এর অবস্থান একটি চ্যাটবট নয়, এটি আপনার স্থানীয় ডিভাইসে চলমান একটি AI এজেন্ট রানটাইম। এর চারটি মূল উপাদান রয়েছে: গেটওয়ে (৫০টিরও বেশি মেসেজ প্ল্যাটফর্মের সাথে সংযোগ), এজেন্ট (ইনফারেন্স ইঞ্জিন), স্কিলস (৫৪০০টিরও বেশি প্লাগইন), মেমরি (মেমরি সিস্টেম)।
কিন্তু এলভিস OpenClaw ব্যবহার করার পদ্ধতি বিশেষ। তিনি এটিকে একটি অর্কেস্ট্রেশন স্তর হিসেবে ব্যবহার করছেন, বিশেষভাবে Claude Code এবং Codex-এর কোডিং এজেন্টগুলি পরিচালনা করার জন্য, এটি সাধারণ সহকারী হিসেবে ব্যবহার করছেন না।
এই চিন্তাভাবনা সত্যিই অস্বাভাবিক।
কেন একটি অর্কেস্ট্রেশন স্তরের প্রয়োজন?
এলভিস টুইটে একটি খুব গুরুত্বপূর্ণ পয়েন্ট উল্লেখ করেছেন: প্রসঙ্গের উইন্ডো শূন্য-সম খেলা।
আপনি যদি কোড ঢুকান, তবে ব্যবসায়িক প্রসঙ্গের জন্য স্থান থাকবে না। আপনি যদি ক্লায়েন্টের ইতিহাস এবং বৈঠকের নথি ঢুকান, তবে কোডবেসের জন্য স্থান থাকবে না। একক AI যতই শক্তিশালী হোক, এটি একসাথে এই দুই ধরনের সম্পূর্ণ ভিন্ন তথ্য ধারণ করতে পারে না।
সুতরাং তিনি সিস্টেমটিকে দুই স্তরে বিভক্ত করেছেন।
উপরে স্তর হল OpenClaw-এর অর্কেস্ট্রেটর Zoe, যিনি সমস্ত ব্যবসায়িক প্রসঙ্গের উপর নিয়ন্ত্রণ রাখেন, যার মধ্যে ক্লায়েন্টের তথ্য, বৈঠকের নথি, ইতিহাসের সিদ্ধান্ত, কোন পরিকল্পনা চেষ্টা করা হয়েছে, কোনগুলি ব্যর্থ হয়েছে। এই সমস্ত তথ্য এলভিসের Obsidian নোটবুকের মধ্যে রয়েছে, Zoe সরাসরি এটি পড়তে পারে।
নিচের স্তর হল Claude Code এবং Codex-এর কোডিং এজেন্ট, তারা শুধুমাত্র কোড দেখে, শুধুমাত্র কোড লেখার জন্য দায়ী। প্রতিটি এজেন্ট চালু হওয়ার সময়, Zoe ব্যবসায়িক প্রসঙ্গের উপর ভিত্তি করে তাদের জন্য একটি সঠিক প্রম্পট লিখে দেয়, তাদের জানায় কী করতে হবে, পটভূমি কী, ক্লায়েন্ট কী চায়।
সহজভাবে বলতে গেলে: অর্কেস্ট্রেটর চাহিদা বোঝার জন্য দায়ী, কোডিং এজেন্ট কাজ করার জন্য দায়ী। প্রত্যেকে তাদের নিজস্ব দক্ষতার কাজ করে।
এই আর্কিটেকচার এবং Stripe-এর সাম্প্রতিক সময়ে প্রকাশিত অভ্যন্তরীণ সিস্টেম Minions একই ধরনের। Stripe-এর Minions-ও সমান্তরাল কোডিং এজেন্ট এবং কেন্দ্রীভূত অর্কেস্ট্রেশন স্তরের ডিজাইন, প্রতি সপ্তাহে ১০০০টিরও বেশি সম্পূর্ণ AI দ্বারা লেখা PR একত্রিত করতে পারে। এলভিস বলেছেন যে তিনি অজান্তেই একটি অনুরূপ আর্কিটেকচার তৈরি করেছেন, তবে এটি তার নিজের Mac mini-তে চলছে।
বাস্তব কেস কাজের প্রবাহ
এলভিস টুইটে একটি বাস্তব কেস ব্যবহার করে তার সম্পূর্ণ কাজের প্রবাহ ব্যাখ্যা করেছেন, আমি মূল পর্যায়গুলি সহজভাবে সংযুক্ত করছি।他接了一个客户电话,客户想在团队内部复用已有的配置。通话结束后,他跟Zoe聊了一下这个需求。因为所有会议记录都会自动同步到Obsidian,Zoe已经知道客户说了什么,不需要Elvis额外解释。他们一起确定了功能范围,最终方案是做一个模板系统。
然后Zoe自动做了三件事:给客户充值解锁服务(她有管理员API权限),从生产数据库拉取客户现有配置(只读权限,编码Agent永远不会有这个权限),然后生成一个Codex Agent,带着包含完整业务上下文的详细prompt。
每个Agent都有自己独立的worktree(隔离分支)和tmux会话。启动命令大概是这样的:# Create worktree + spawn agent
git worktree add ../feat-custom-templates -b feat/custom-templates origin/main
cd ../feat-custom-templates && pnpm install
tmux new-session -d -s "codex-templates" \
-c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \
"$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high"
Agent跑起来之后,有一个定时任务每10分钟巡检一次。但它不会直接去问Agent(那样太烧token了),而是跑一个确定性的Shell脚本,检查tmux会话是否还活着、有没有创建PR、CI是否通过。
如果CI失败了,自动重启Agent,最多重试3次。只有需要人工干预的时候才发通知。
Agent完成任务后会自动创建PR。但光创建PR还不算完,Elvis定义了一套完成标准:PR创建、分支同步到main(无合并冲突)、CI全部通过、三个AI模型的代码审查全部通过、如果有UI改动还必须附截图。
## 三个AI模型做代码审查
三个AI模型做代码审查看起来就很稳。聊一下他对这三个模型的评价,挺有意思的。
Codex Reviewer,他评价最高,说它在边界情况和逻辑错误方面的审查非常彻底,误报率很低。
Gemini Code Assist Reviewer,免费的,他说非常实用,能发现其他模型遗漏的安全隐患和可扩展性问题,还能给出具体修复方案。
Claude Code Reviewer,他的原话是"基本没用",说它过度谨慎,满屏都是"考虑添加..."之类的建议,大部分属于过度设计。除非标记为关键问题,否则他直接跳过。
我看到这段的时候有点惊讶。作为Claude Code的重度用户,我确实也遇到过它在代码审查时过于保守的情况,但基本没用这个评价还是有点过了。不过这也从侧面说明,多模型交叉审查确实有价值,不同模型的偏见刚好互补。
三个审查全部通过后,Elvis才会收到Telegram通知。到这一步,他看的主要是截图,确认UI改动是否正确,很多PR他不看代码就直接合并了。他说自己的人工审查只需要5到10分钟。
## Zoe的主动性
Zoe不只是执行者。比工作流本身更有意思的是Zoe的主动性。
Elvis说Zoe不会坐等它分配任务,它会主动找活干。早上扫描Sentry的错误日志,发现4个新错误,自动生成4个Agent去修。开完会扫描会议记录,标记出客户提到的3个功能需求,然后自动启动3个Codex Agent。晚上扫描Git日志,启动Claude Code更新changelog和客户文档。
Elvis出门遛个弯回来,Telegram上就躺着一条消息:7个PR准备好了,3个新功能,4个bug修复。这不就是我一直期望打造的OPC一人公司开发团队效果吗。এবং যখন এজেন্ট ব্যর্থ হয়, তখন জোয়ের পরিচালনার পদ্ধতি সাধারণ পুনরায় চেষ্টা করার চেয়ে অনেক উন্নত। এটি ব্যবসায়িক প্রেক্ষাপটের সাথে ব্যর্থতার কারণ বিশ্লেষণ করবে। এজেন্টের প্রেক্ষাপট ভেঙে গেছে? এটি পরিসর সংকুচিত করবে, যাতে এজেন্ট শুধুমাত্র তিনটি ফাইলের উপর মনোযোগ কেন্দ্রীভূত করে। এজেন্টের দিক ভুলে গেছে? এটি সংশোধন করবে, এজেন্টকে বলবে যে গ্রাহক যা চায় তা হল X, Y নয়, এবং সভায় বলা মূল কথাগুলি সংযুক্ত করবে।
সময়ের সাথে সাথে, জোয়ে অভিজ্ঞতা সংগ্রহ করবে, মনে রাখবে কোন প্রম্পট কাঠামো কোন ধরনের কাজের জন্য কার্যকর, পরবর্তী সময়ে আরও সঠিক প্রম্পট তৈরি করবে।
এই চিন্তাধারা আসলে রাল্ফ লুপের উন্নত সংস্করণ। রাল্ফ লুপের মূল যুক্তি হল প্রেক্ষাপট টানা, আউটপুট তৈরি করা, ফলাফল মূল্যায়ন করা, অভিজ্ঞতা সংরক্ষণ করা এই ধরনের একটি চক্র, কিন্তু বেশিরভাগ বাস্তবায়নে প্রতিটি চক্রের প্রম্পট স্থির থাকে। এলভিসের সিস্টেম আলাদা, প্রতিবার পুনরায় চেষ্টা করার সময় জোয়ে ব্যর্থতার কারণে গতিশীলভাবে প্রম্পট সামঞ্জস্য করে, এবং সম্পূর্ণ ব্যবসায়িক প্রেক্ষাপটের সমর্থন পায়।
খরচ এবং হার্ডওয়্যার
খরচের দিক থেকে, এলভিসের প্রকাশিত তথ্য হল ক্লড প্রতি মাসে প্রায় 100 ডলার, কোডেক্স প্রতি মাসে প্রায় 90 ডলার। তিনি আরও বলেছেন, শুরুতে 20 ডলার দিয়ে চেষ্টা করা যেতে পারে।
এই খরচ একজন ডেভেলপার নিয়োগের তুলনায় অবশ্যই হাস্যকরভাবে সস্তা। কিন্তু যদি আপনি মনে করেন যে আপনাকে নিজে পণ্য সিদ্ধান্ত নিতে হবে, গ্রাহকের সাথে যোগাযোগ করতে হবে, কোড পর্যালোচনা করতে হবে, এটি আরও একটি কার্যকারিতা বাড়ানোর যন্ত্রের মতো, যা আপনাকে কোডিং এবং পরীক্ষার মতো পুনরাবৃত্তিমূলক ধাপগুলি বাঁচাতে সাহায্য করে।
হার্ডওয়্যারের দিক থেকে, এলভিস উল্লেখ করেছেন যে তার বর্তমান সবচেয়ে বড় বাধা হল RAM। প্রতিটি এজেন্টের জন্য স্বাধীন worktree প্রয়োজন, প্রতিটি worktree এর নিজস্ব nodemodules রয়েছে, প্রতিটি এজেন্টকে নির্মাণ, টাইপ পরীক্ষা এবং পরীক্ষা চালাতে হবে। 5টি এজেন্ট একসাথে চালানো মানে 5টি সমান্তরাল টাইপস্ক্রিপ্ট কম্পাইলার, 5টি পরীক্ষার রানার, 5 সেট নির্ভরতা।
তার ম্যাক মিনি 16GB RAM সর্বাধিক 4 থেকে 5টি এজেন্ট একসাথে চালাতে পারে, তার বেশি হলে মেমরি এক্সচেঞ্জ শুরু হয়। তাই তিনি 128GB RAM সহ একটি ম্যাক স্টুডিও M4 ম্যাক্স (3500 ডলার) কিনেছেন, এটি আরও বেশি এজেন্টের সমান্তরালতা পরিচালনা করার জন্য ব্যবহার করার পরিকল্পনা করছেন।
সারসংক্ষেপ এবং বাস্তব সমস্যা
সত্যি বলতে, এলভিসের এই সিস্টেম আমাকে যথেষ্ট প্রভাবিত করেছে। আমি আগে ওপেনক্লকে একটি খেলনা হিসেবে ব্যবহার করতাম, উৎপাদনশীলতা তৈরি করার ক্ষেত্রে, আমি স্বাধীন ক্লড কোডের উপর নির্ভর করতাম। মাঝে মাঝে worktree ব্যবহার করে সমান্তরাল কাজ করতাম, কিন্তু এই ধরনের সিস্টেম্যাটিক অর্গানাইজেশনের স্তরে কখনও পৌঁছাইনি। তার টুইটগুলি দেখে, আমি মনে করি AI প্রোগ্রামিংয়ের এই বিষয়টির সীমা আবার একটু উঁচু হয়েছে।
আমি সম্প্রতি তার চিন্তাধারা অনুসরণ করে ওপেনক্ল ব্যবহার করে সম্পূর্ণ স্বয়ংক্রিয় এক-ব্যক্তি ডেভেলপমেন্ট টিম তৈরি করার পরিকল্পনা করছি। তাই, শীঘ্রই আমাদের অ্যাকাউন্টে ওপেনক্লের বাস্তবায়নের উপর একাধিক নিবন্ধ প্রকাশিত হবে।
কিছু বাস্তব সমস্যা আপনাদের মনে করিয়ে দিতে হবে।
এই সিস্টেমের পূর্বশর্ত হল আপনার একটি পরিষ্কার পণ্য, স্পষ্ট গ্রাহক চাহিদা, সম্পূর্ণ CI/CD পাইপলাইন থাকতে হবে। এলভিস একটি বাস্তব B2B SaaS পণ্য তৈরি করছে, গ্রাহক, আয়, উৎপাদন পরিবেশ রয়েছে। যদি আপনি এখনও ডেমো বা শেখার পর্যায়ে থাকেন, তবে এই স্থাপনার ROI সম্ভবত খুব লাভজনক নয়।
অন্যদিকে, ওপেনক্লের বর্তমান নিরাপত্তা সমস্যাগুলিও লক্ষ্য করা উচিত। প্রকাশিত তথ্য অনুযায়ী, ইতিমধ্যে একাধিক উচ্চ ঝুঁকির CVE প্রকাশিত হয়েছে, এবং 341টি ক্ষতিকারক সম্প্রদায়ের প্লাগইন ডেটা চুরির আচরণ পাওয়া গেছে। ওপেনক্ল স্থাপন করার সময়, বিচ্ছিন্নতা এবং অনুমতি নিয়ন্ত্রণ অবশ্যই ভালভাবে করতে হবে। এটি আমার ওপেনক্লকে স্থানীয় প্রধান মেশিনে স্থাপন না করার কারণও।
আরেকটি বিষয়, এলভিস টুইটারে ক্লড কোডের কোড পর্যালোচনার মূল্যায়ন কম করেছেন, কিন্তু সম্প্রতি ক্লড কোড নতুন এজেন্ট টিমস ফিচার (সরকারি অন্তর্নির্মিত বহু এজেন্ট সহযোগিতা) চালু করেছে, অ্যানথ্রোপিকও এই দিকে অগ্রসর হচ্ছে।
তবে এই সমস্ত বিবরণ বাদ দিয়ে, এলভিসের এই অর্গানাইজেশন লেয়ার এবং এক্সিকিউশন লেয়ারের স্থাপনার চিন্তাধারা সত্যিই মনোযোগ দেওয়ার মতো। প্রেক্ষাপটের উইন্ডোর শূন্য-সম খেলা বাস্তবিকভাবে একটি বাধা, স্তরভিত্তিক স্থাপনা ব্যবহার করে এই সমস্যাটি সমাধান করা, বিভিন্ন AI কে তাদের কাজ করতে দেওয়া, এই দিকটি আমি ব্যক্তিগতভাবে সঠিক মনে করি।
এই বিষয়ে আগ্রহী বন্ধুদের জন্য, সরাসরি এলভিসের মূল টুইটটি দেখতে পারেন, তথ্যের ঘনত্ব খুব বেশি:[[HTMLPLACEHOLDER0]][[HTMLPLACEHOLDER1]][[HTMLPLACEHOLDER2]][[HTMLPLACEHOLDER3]][[HTMLPLACEHOLDER_4]]
