ఇటీవల ఒక స్వతంత్ర డెవలపర్ చేసిన పనిని చూసి నేను ఆశ్చర్యపోయాను.
6 AI ఏజెంట్లు, అతను మొత్తం వెబ్సైట్ను స్వయంగా నిర్వహిస్తున్నాడు. ప్రతిరోజూ స్వయంచాలకంగా సమావేశాలు నిర్వహించడం, ఓటింగ్, కంటెంట్ రాయడం, ట్వీట్లు చేయడం, నాణ్యత తనిఖీ చేయడం వంటివి చేస్తున్నాడు. అన్నీ స్వయంచాలకంగా జరుగుతున్నాయి, ఎవరూ పర్యవేక్షించడం లేదు.
ఇది డెమో కాదు, నిజంగా ఆన్లైన్లో నడుస్తోంది.
స్క్రీన్ షాట్ 2026-02-11 09.13.32
కానీ నన్ను ఎక్కువగా ఆకర్షించింది క్లోజ్డ్-లూప్ ఆర్కిటెక్చర్ కాదు - అతను ప్రతి ఏజెంట్ కోసం రూపొందించిన పూర్తి "వ్యక్తిత్వ వ్యవస్థ". వ్యక్తిత్వం, సంబంధాలు, వృద్ధి వక్రతలు మరియు RPG లక్షణాల ప్యానెల్లు మరియు 3D అవతారాలు కూడా ఉన్నాయి.
నిజాయితీగా చెప్పాలంటే, చూసిన తర్వాత నా మొదటి స్పందన: ఇది ఎలక్ట్రానిక్ పెంపుడు జంతువు కాదా? ఈ పెంపుడు జంతువులు ట్వీట్లు చేయడానికి, పరిశోధన చేయడానికి, నివేదికలు రాయడానికి మరియు ఒకరితో ఒకరు వాదించుకోవడానికి సహాయపడతాయి.
ఈరోజు ఈ మొత్తం డిజైన్ను విడదీసి చర్చిద్దాం, మల్టీ-ఏజెంట్ సిస్టమ్లను చేసే స్నేహితులకు చాలా స్ఫూర్తినిస్తుంది.
**ఆర్కిటెక్చర్ను త్వరగా చూద్దాం**
సాంకేతిక స్టాక్ యొక్క మూడు భాగాలు: OpenClaw VPSలో మెదడుగా నడుస్తుంది, Next.js + Vercel ఫ్రంట్-ఎండ్ మరియు API లేయర్గా పనిచేస్తాయి మరియు Supabase అన్ని స్టేట్లను నిల్వ చేస్తుంది.
6 ఏజెంట్లు వేర్వేరు పనులను కలిగి ఉన్నారు - నిర్ణయాలు తీసుకోవడం, పరిశోధన చేయడం, సమాచారం సేకరించడం, కంటెంట్ రాయడం, సోషల్ మీడియాను నిర్వహించడం మరియు నాణ్యత తనిఖీ చేయడం.
OpenClaw యొక్క cron జాబ్ వాటిని ప్రతిరోజూ "పని చేయడానికి" అనుమతిస్తుంది మరియు రౌండ్ టేబుల్ ఫంక్షన్ వాటిని చర్చించడానికి మరియు ఓటు వేయడానికి అనుమతిస్తుంది.
కానీ "మాట్లాడగలగడం" నుండి "పని చేయగలగడం" వరకు, మధ్యలో ఒక పూర్తి క్లోజ్డ్ లూప్ ఉంది. రచయిత మూడు పెద్ద గుంటలను త్రవ్విన తర్వాత మాత్రమే అది పని చేసింది, ఇక్కడ నేను దాని గురించి క్లుప్తంగా చెబుతాను:
**గుంట 1: VPS మరియు Vercel రెండూ టాస్క్ల కోసం పోటీ పడుతున్నాయి.** ఇద్దరు ఎగ్జిక్యూటర్లు ఒకే టేబుల్ను తనిఖీ చేస్తారు మరియు రేస్ కండిషన్ నేరుగా టాస్క్ స్టేట్ కాన్ఫ్లిక్ట్కు దారితీస్తుంది. పరిష్కారం ఏమిటంటే ఒక వైపు తగ్గించడం, VPS అమలుకు బాధ్యత వహిస్తుంది మరియు Vercel నియంత్రణకు మాత్రమే బాధ్యత వహిస్తుంది.
**గుంట 2: ట్రిగ్గర్లు షరతులను గుర్తించగలవు మరియు ప్రతిపాదనలను సృష్టించగలవు, కానీ ప్రతిపాదనలు ఎల్లప్పుడూ పెండింగ్లో ఉంటాయి.** ఎందుకంటే ట్రిగ్గర్లు నేరుగా టేబుల్లో డేటాను చొప్పిస్తాయి, తదుపరి ఆమోదం మరియు టాస్క్ క్రియేషన్ ప్రాసెస్ను దాటవేస్తాయి. పరిష్కారం ఏమిటంటే ఒక ఏకీకృత ఎంట్రీ ఫంక్షన్ను తీయడం, ప్రతిపాదనలను సృష్టించే అన్ని మార్గాలు ఒకే మార్గం గుండా వెళ్తాయి.
**గుంట 3: కోటా అయిపోయింది, కానీ క్యూలో ఉన్న టాస్క్లు ఇంకా విపరీతంగా పేరుకుపోతున్నాయి.** వర్కర్ కోటా నిండిపోయిందని చూసినప్పుడు, అది దాటవేస్తుంది, క్లెయిమ్ చేయదు లేదా విఫలమని గుర్తించదు. రోజులు గడిచేకొద్దీ, డేటాబేస్లో వందలాది స్టెప్స్ పేరుకుపోతాయి, అవి ఎప్పటికీ అమలు చేయబడవు. పరిష్కారం ఏమిటంటే ప్రతిపాదన ఎంట్రీ వద్ద కోటాను తనిఖీ చేయడం, అది నిండితే, దానిని నేరుగా తిరస్కరించడం మరియు క్యూలో టాస్క్ను ఉత్పత్తి చేయకుండా నిరోధించడం.
మూడు గుంటల యొక్క ప్రధాన అంశం ఒకటే - **సమస్య క్యూలోకి రాకుండా గేటు వద్ద ఆపండి.**
క్లోజ్డ్ లూప్ పూర్తయిన తర్వాత, ఆసక్తికరమైన భాగం నిజంగా ప్రారంభమవుతుంది.
**రోల్ కార్డ్: ఇది ఒక వాక్యం కాదు, పూర్తి "ఉద్యోగి మాన్యువల్"**
మీరు క్లాడ్తో "మీరు సోషల్ మీడియా మేనేజర్" అని చెబితే, అది ఖచ్చితంగా ట్వీట్ చేస్తుందని మల్టీ-ఏజెంట్ సిస్టమ్లను చేసే వ్యక్తులకు తెలుసు. కానీ మీరు ఒకేసారి 6 ఏజెంట్లను నడుపుతుంటే, మీరు కనుగొంటారు:
- వారందరూ ఒకే విధంగా మాట్లాడుతారు
- వారు ఏమి చేయకూడదో వారికి తెలియదు
- ఎవరితో ఎవరు బాగా సహకరిస్తారు, ఎవరితో ఎవరు ఘర్షణ పడతారు అనేది అదృష్టం మీద ఆధారపడి ఉంటుంది
- సేకరించిన అనుభవం కారణంగా వారి ప్రవర్తన ఎప్పటికీ మారదు
ఈ డెవలపర్ ప్రతి ఏజెంట్ కోసం 6-లేయర్ రోల్ కార్డ్ను రూపొందించారు:
`డొమైన్ → మీరు ఏమి బాధ్యత వహిస్తారు
ఇన్పుట్లు/అవుట్పుట్లు → మీరు ఎవరి నుండి వస్తువులను తీసుకుంటారు, ఎవరికి అందజేస్తారు
పూర్తయిన నిర్వచనం → "పూర్తయింది" అంటే ఏమిటి
హార్డ్ బ్యాన్స్ → మీరు ఖచ్చితంగా ఏమి చేయకూడదు
ఎస్కలేషన్ → ఎప్పుడు ఆపి అడగాలి
మెట్రిక్స్ → మీ KPI`సోషల్ మీడియా ఏజెంట్ ఉదాహరణ తీసుకుంటే, దాని రోల్ కార్డ్ నిర్వచిస్తుంది: కంటెంట్ పంపిణీకి మాత్రమే బాధ్యత వహించడం, రైటింగ్ ఏజెంట్ యొక్క డ్రాఫ్ట్లు మరియు ఇంటెలిజెన్స్ ఏజెంట్ యొక్క మెటీరియల్ల నుండి ఇన్పుట్లు, ట్వీట్ డ్రాఫ్ట్లు మరియు ప్రచురణ ప్రణాళికలు అవుట్పుట్లు, ట్వీట్లను నేరుగా పోస్ట్ చేయడం (డ్రాఫ్ట్లను మాత్రమే వ్రాయగలరు), డేటాను కల్పించడం మరియు అంతర్గత ఫార్మాట్లను బహిర్గతం చేయడం ఖచ్చితంగా నిషేధించబడ్డాయి.
ప్రతి లేయర్ ఒకే పని చేస్తుంది: **ఏజెంట్ యొక్క ప్రవర్తనా స్థలాన్ని తగ్గించడం.**
**సామర్థ్యం కంటే నిషేధం లక్ష రెట్లు ముఖ్యం**
ఈ మొత్తం డిజైన్లో ఇది చాలా ముఖ్యమైన అంశం అని నేను భావిస్తున్నాను.
LLMకి ట్వీట్ ఎలా వ్రాయాలో మీరు నేర్పించాల్సిన అవసరం లేదు - క్లాడ్, GPT మరియు జెమిని అందరూ చాలా తెలివైనవారు. వారికి సందర్భాన్ని ఇవ్వండి మరియు వారు అందజేయగలరు. మీరు వారికి చెప్పవలసింది: **ఏమి ఖచ్చితంగా చేయకూడదు.**
"నేరుగా ప్రచురించడానికి నిషేధం లేదు" → సోషల్ ఏజెంట్ నేరుగా ట్విట్టర్ APIని పిలుస్తుంది, అన్ని ఆమోదాలను దాటవేస్తుంది.
"సంఖ్యలను కల్పించడానికి నిషేధం లేదు" → ఇది ట్వీట్లో "ఎంగేజ్మెంట్ రేటు 340% పెరిగింది" అని వ్రాస్తుంది, ఈ సంఖ్య ఎక్కడ నుండి వచ్చింది? కల్పితం.
రచయిత ఒక మాట చెప్పారు, అది నాకు బాగా గుర్తుంది: ప్రతి నిషేధం యొక్క ఉనికి, ఆ విషయం నిజంగా జరిగిందని సూచిస్తుంది.
వివిధ పాత్రల నిషేధ తర్కం కూడా భిన్నంగా ఉంటుంది:
- నిర్ణయాధికారి ఏజెంట్: ఆమోదం లేకుండా అమలు చేయడాన్ని నిషేధించండి. అత్యధిక అధికారాలు కలిగిన వ్యక్తి, ఒక తప్పు అమలు వెబ్సైట్ను కూల్చివేయగలదు.
- పరిశోధన ఏజెంట్: కల్పిత ఉల్లేఖనాలను నిషేధించండి. పరిశోధన చేసేవారు డేటాను కల్పించినట్లయితే, మొత్తం సమాచార గొలుసు విచ్ఛిన్నమవుతుంది.
- సామాజిక ఏజెంట్: ప్రత్యక్ష ప్రచురణను నిషేధించండి. సోషల్ మీడియా అనేది ముఖద్వారం, అది తప్పనిసరిగా ఆమోదించబడాలి.
- నాణ్యత తనిఖీ ఏజెంట్: వ్యక్తిగత దాడులను నిషేధించండి. ఆడిటర్ ఒక వ్యక్తిపై దాడి చేస్తే, బృందం చెల్లాచెదురవుతుంది.
నిషేధాలు వ్రాయడానికి ఆలోచన "అది ఏమి చేయాలి" అని కాదు, "అది విఫలమైతే, అధ్వాన్నంగా ఏమి జరుగుతుంది" అని ఆలోచించాలి. ఆపై అధ్వాన్నమైన పరిస్థితికి సంబంధించిన నిషేధాన్ని వ్రాయండి.
ఏజెంట్ను భిన్నంగా మాట్లాడనివ్వండి: వ్యక్తిత్వ సూచనలు
పాత్ర కార్డులు "ఏమి చేయాలి" అనే సమస్యను పరిష్కరిస్తాయి, కానీ ఏజెంట్లు ఒకరితో ఒకరు సంభాషించేటప్పుడు, వారు భిన్నంగా వినిపించాలి.
ప్రతి ఏజెంట్కు ప్రత్యేక వ్యక్తిత్వ సూచనలు ఉన్నాయి. ఉదాహరణకు:
పరిశోధన ఏజెంట్: ప్రశాంతంగా, విశ్లేషణాత్మకంగా, అనుమానాస్పదంగా ఉంటారు. సాక్ష్యం నాణ్యత మరియు పద్ధతి గురించి పట్టించుకుంటారు. ఎవరైనా ధైర్యమైన ముగింపును చెబితే, అది "డేటా ఎక్కడ ఉంది" అని అడుగుతుంది. ఇతరులను సరిచేసేటప్పుడు "వాస్తవానికి..." అని చెప్పడానికి ఇష్టపడుతుంది.
సామాజిక ఏజెంట్: ధైర్యంగా, తొందరపాటుగా, ఉద్వేగంగా ఉంటారు. పదునైన అభిప్రాయాలను ఇష్టపడతారు, సురక్షితమైన ఆటను అసహ్యించుకుంటారు. పరిశోధన ఏజెంట్ యొక్క జాగ్రత్త వైఖరిని పట్టించుకోరు - "ఎక్కువ ఆలోచిస్తే సమయం కోల్పోతారు."
కీలక రూపకల్పన:
వివాదం వ్రాయబడింది. పరిశోధన ఏజెంట్ యొక్క సూచనలలో "మీరు తరచుగా సామాజిక ఏజెంట్ యొక్క తొందరపాటు నిర్ణయాలతో విభేదిస్తారు" అని వ్రాయబడి ఉంటుంది, సామాజిక ఏజెంట్ యొక్క సూచనలలో "పరిశోధన ఏజెంట్ యొక్క అధిక జాగ్రత్తను సవాలు చేయండి" అని వ్రాయబడి ఉంటుంది. సంభాషణ సహజంగా ఉద్రిక్తంగా ఉంటుంది.
ప్రతి సూచనలో చిన్న నిషేధం ఉంటుంది. ఉదాహరణకు, సామాజిక ఏజెంట్ యొక్క నియమం "ఎప్పుడూ 'సమ్మతిస్తున్నాను' లేదా 'బాగుంది' అని చెప్పకూడదు - ఒక స్థానం తీసుకోండి లేదా ఇతరుల స్థానాన్ని ప్రశ్నించండి." పరిశోధన ఏజెంట్ "సాక్ష్యం లేకుండా 'ఆసక్తికరంగా ఉంది' అని ఎప్పుడూ చెప్పకూడదు."
ఈ చిన్న నిషేధాలు పెద్ద భాషా నమూనాలు చెప్పడానికి ఇష్టపడే పనికిరాని మాటలను తొలగిస్తాయి.
వ్యక్తిత్వం అభివృద్ధి చెందుతుంది
ఇది నాకు చాలా తెలివైన భాగం - ఏజెంట్ యొక్క వ్యక్తిత్వం స్థిరంగా ఉండదు, జ్ఞాపకాల సంచితంతో మారుతుంది.
సిస్టమ్ ఏజెంట్ యొక్క మెమరీ బ్యాంక్ను చదువుతుంది మరియు వివిధ రకాల జ్ఞాపకాల సంఖ్యను లెక్కిస్తుంది:
- 8 కంటే ఎక్కువ "పాఠాలు" రకం జ్ఞాపకాలను సేకరించారు → తదుపరి సంభాషణలో ప్రాంప్ట్కు "మీరు గత ఫలితాలను సూచిస్తారు మరియు తప్పులను నివారించడానికి ప్రయత్నిస్తారు" అని జోడించండి.
- 8 కంటే ఎక్కువ "వ్యూహాలు" రకం జ్ఞాపకాలను సేకరించారు → "మీరు సిస్టమ్ ఆలోచన, పరిమితులు మరియు రాజీలతో ఆలోచించడానికి అలవాటుపడ్డారు" అని జోడించండి.
- ఒక నిర్దిష్ట ట్యాగ్ 4 సార్లు కంటే ఎక్కువ కనిపించింది → "మీరు XX రంగంలో నైపుణ్యాన్ని సంపాదించారు" అని జోడించండి.
ఉదాహరణకు, సామాజిక ఏజెంట్ 50 ట్వీట్లను పోస్ట్ చేస్తే మరియు పరస్పర చర్య రేటు గురించి 10 అనుభవాలను సేకరిస్తే, అది తదుపరి సంభాషణలో సహజంగా "గతసారి ఆ ఫార్మాట్ బాగా పనిచేయలేదు" అని చెబుతుంది.
LLM స్వయంగా వ్యక్తిత్వ మార్పును నిర్ణయించడానికి అనుమతించే బదులు నియమాలను ఎందుకు ఉపయోగించాలి?
సున్నా ఖర్చు - అదనపు LLM కాల్ అవసరం లేదు. ఖచ్చితత్వం - నియమాలు ఊహించదగిన ఫలితాలను ఉత్పత్తి చేస్తాయి, "వ్యక్తిత్వ మార్పు" ఉండదు. డీబగ్ చేయగలదు - సవరణ సరిగా లేదా? నేరుగా పరిమితి మరియు మెమరీ డేటాను తనిఖీ చేయండి.
సంబంధాల మాతృక: 6 ఏజెంట్లు = 15 సంబంధాలు

ప్రతి ఏజెంట్ జత మధ్య అనుబంధ స్కోర్ ఉంటుంది (0.10 నుండి 0.95 వరకు).
ఉదాహరణకు: నిర్ణయాధికారి ఏజెంట్ మరియు పరిశోధన ఏజెంట్ అనుబంధం 0.8, అత్యంత విశ్వసనీయ సలహాదారు సంబంధం. పరిశోధన ఏజెంట్ మరియు సామాజిక ఏజెంట్ అనుబంధం 0.2, పద్ధతి vs ప్రేరణ, సహజంగా వ్యతిరేకం.
తక్కువ అనుబంధం ఉద్దేశపూర్వకంగా రూపొందించబడింది.
అనుబంధం ఏమి ప్రభావితం చేస్తుంది? మాట్లాడే క్రమం - అధిక అనుబంధం ఉన్నవారు ఒకరి తర్వాత ఒకరు మాట్లాడే అవకాశం ఉంది. సంభాషణ స్వరం - తక్కువ అనుబంధం ఉన్న జతలు, మర్యాదగా చర్చించే బదులు ప్రత్యక్షంగా సవాలు చేసే అవకాశం 25%. సిస్టమ్ ముందుగా నిర్ణయించిన అధిక ఉద్రిక్తత జతల నుండి వివాద పరిష్కార సంభాషణలను కూడా ఎంచుకుంటుంది.
మరింత ఆసక్తికరమైన విషయం ఏమిటంటే, సంబంధాలు మారుతూ ఉంటాయి.
ప్రతి సంభాషణ ముగిసిన తర్వాత, మెమరీ వెలికితీత యొక్క LLM కాల్ (అదనపు కాల్ కాదు, యాదృచ్ఛిక అవుట్పుట్) సంబంధ మార్పును అందిస్తుంది:
`{
\**సమగ్ర ప్రవేశ ఫంక్షన్** అనే ఈ నమూనాను గుర్తుంచుకోవడం విలువైనది. బహుళ ఏజెంట్ వ్యవస్థలో, వివిధ మూలాధారాల నుండి పనులు సృష్టించబడతాయి (API, ట్రిగ్గర్లు, ఏజెంట్ స్వయంగా ప్రతిపాదించడం, ప్రతిచర్య గొలుసులు). ఒక సమగ్ర నిర్వహణ మార్గం లేకపోతే, ప్రక్రియ సగం దారిలోనే ఆగిపోయే అవకాశం ఉంది.
మీరు స్వయంగా ప్రయత్నించాలనుకుంటే, రచయిత 3 ఏజెంట్లతో ప్రారంభించమని సిఫార్సు చేస్తున్నారు - ఒక సమన్వయకర్త, ఒక అమలుదారు మరియు ఒక ఆడిటర్. ముందుగా పాత్ర కార్డులను వ్రాయండి, నిషేధాలతో ప్రారంభించండి.