Čovjek pokrenuo 6 AI Agent tvrtki, 30 web stranica uživo u tjedan dana

2/13/2026
8 min read

Nedavno sam vidio nešto što je napravio nezavisni programer i ostao sam bez riječi.

6 AI Agenata, sami upravljaju cijelom web stranicom. Svaki dan automatski održavaju sastanke, glasaju, pišu sadržaj, objavljuju na Twitteru, provode kontrolu kvalitete. Potpuno automatski, nitko ih ne nadzire.

Nije demo, stvarno radi online.

截屏2026-02-11 09.13.32截屏2026-02-11 09.13.32

Ali ono što me najviše oduševilo nije arhitektura zatvorene petlje - već to što je svakom Agentu dizajnirao kompletan "sustav osobnosti". Imaju osobnost, odnose, krivulju rasta, čak i RPG atribute i 3D avatare.

Iskreno, nakon što sam to vidio, prva mi je reakcija bila: zar to nisu elektronički ljubimci? Samo što ti ljubimci pomažu u objavljivanju tweetova, provođenju istraživanja, pisanju izvješća, pa čak i svađaju se međusobno.

Danas ću rastaviti cijeli ovaj dizajn i razgovarati o njemu, prijatelji koji rade na sustavima s više Agenata trebali bi imati puno inspiracije.

Prvo brzo prođimo kroz arhitekturu

Tehnološki stack od tri dijela: OpenClaw radi na VPS-u kao mozak, Next.js + Vercel rade frontend i API sloj, Supabase pohranjuje sve statuse.

6 Agenata imaju različite zadatke - neki donose odluke, neki istražuju, neki prikupljaju informacije, neki pišu sadržaj, neki upravljaju društvenim medijima, neki provode kontrolu kvalitete.

OpenClaw-ov cron job im omogućuje da svakodnevno "dolaze na posao", a funkcija okruglog stola im omogućuje raspravu i glasanje.

Ali od "mogućnosti govora" do "mogućnosti rada", postoji cijela zatvorena petlja. Autor je nagazio na tri velike zamke prije nego što je uspio pokrenuti, ovdje ću to ukratko objasniti:

Zamka 1: VPS i Vercel se istovremeno bore za zadatke. Dva izvršitelja provjeravaju istu tablicu, uvjeti utrke izravno dovode do sukoba statusa zadataka. Rješenje je odsjeći jednu stranu, VPS je odgovoran za izvršenje, a Vercel samo za kontrolnu površinu.

Zamka 2: Okidači mogu otkriti uvjete, mogu kreirati prijedloge, ali prijedlozi zauvijek ostaju u stanju čekanja. Jer okidači izravno ubacuju podatke u tablicu, preskačući kasniji postupak odobravanja i kreiranja zadataka. Rješenje je izvući jedinstvenu ulaznu funkciju, svi putevi za kreiranje prijedloga prolaze kroz istu.

Zamka 3: Kvota je potrošena, ali zadaci u redu čekanja se i dalje ludo gomilaju. Worker vidi da je kvota puna i preskače, niti preuzima niti označava neuspjeh, s vremenom se u bazi podataka nakupi stotine koraka koji se nikada neće izvršiti. Rješenje je provjeriti kvotu na ulazu u prijedlog, ako je puna, izravno je odbiti i ne dopustiti da generira zadatke u redu čekanja.

Jezgra sve tri zamke je ista stvar - zaustavite problem na ulazu, ne dopustite mu da uđe u red čekanja.

Nakon što se zatvorena petlja pokrene, zanimljivi dijelovi tek počinju.

Kartica uloge: nije jedna rečenica, već kompletan "priručnik za zaposlenike"

Ljudi koji rade na sustavima s više Agenata znaju da ako kažete Claudeu "ti si menadžer društvenih medija", on će doista objavljivati tweetove. Ali ako istovremeno pokrenete 6 takvih Agenata, otkrit ćete:

  • Svi govore na isti način

  • Ne znaju što ne bi trebali raditi

  • Tko dobro surađuje s kim, a tko je u sukobu s kim, ovisi o sreći

  • Nikada neće promijeniti ponašanje zbog stečenog iskustva

Ovaj programer je dizajnirao 6 slojeva kartica uloga za svakog Agenta:

Domain → Za što ste odgovorni Inputs/Outputs → Od koga dobivate stvari, kome ih isporučujete Definition of Done → Što znači "gotovo" Hard Bans → Što apsolutno ne smijete raditi Escalation → Kada prestati i zatražiti upute Metrics → Vaši KPI-jevi Uzmimo za primjer Agenta za društvene medije, njegova kartica uloge definira: odgovoran je samo za distribuciju sadržaja, ulaz je rukopis od Agenta za pisanje i materijal od Agenta za obavještavanje, izlaz je nacrt tweeta i plan objave, strogo je zabranjeno izravno objavljivanje tweetova (može samo pisati nacrte), zabranjeno je izmišljanje podataka, zabranjeno je otkrivanje internog formata.

Svaki sloj radi istu stvar: smanjuje prostor ponašanja Agenta.

Zabrane su milijun puta važnije od sposobnosti

Ovo je po meni najvažnija točka u cijelom dizajnu.

Ne morate učiti LLM kako pisati tweetove - Claude, GPT, Gemini su dovoljno pametni. Dajte mu kontekst i može isporučiti. Ono što mu trebate reći je: što se apsolutno ne smije raditi.

Nema "zabrane izravnog objavljivanja" → Agent za društvene medije izravno poziva Twitter API, preskačući sva odobrenja.

Nema "zabrane izmišljanja brojeva" → Napisat će u tweetu "stopa interakcije povećana za 340%", odakle taj broj dolazi? Izmišljen je.Autor je rekao rečenicu koju dobro pamtim: Svaka zabrana postoji jer se ta stvar stvarno dogodila.

Logika zabrana se razlikuje ovisno o ulozi:

  • Agent za donošenje odluka: Zabranjeno je raspoređivanje bez odobrenja. Ima najveće ovlasti, a jedno pogrešno raspoređivanje može srušiti web stranicu.

  • Istraživački agent: Zabranjeno je izmišljanje citata. Ako istraživač krivotvori podatke, cijeli informacijski lanac je uništen.

  • Socijalni agent: Zabranjeno je izravno objavljivanje. Društveni mediji su izlog, moraju biti odobreni.

  • Agent za kontrolu kvalitete: Zabranjeno je osobno vrijeđanje. Ako revizor napadne pojedinca, tim se raspada.

Ideja pisanja zabrana nije "što bi trebao raditi", već "što je najgore što se može dogoditi ako zabrlja". Zatim napišite zabrane za najgori scenarij.

Neka agenti govore drugačije: Upute o osobnosti

Kartica uloge rješava problem "što raditi", ali kada agenti međusobno razgovaraju, također je potrebno da zvuče drugačije.

Svaki agent ima zasebne upute o osobnosti. Na primjer:

Istraživački agent: Smiren, analitičan, skeptičan. Brine se o kvaliteti dokaza i metodologiji. Ako netko iznese hrabar zaključak, pitat će "Gdje su podaci?". Kada ispravlja druge, voli reći "Zapravo..."

Socijalni agent: Hrabar, nestrpljiv, marginaliziran. Voli oštre stavove, mrzi sigurne karte. Ne mari za oprez istraživačkog agenta - "Previše razmišljanja propušta priliku."

Ključni dizajn:

Sukob je upisan. U uputama istraživačkog agenta piše "Često se ne slažete s impulzivnim odlukama socijalnog agenta", a u uputama socijalnog agenta piše "Izazovite pretjerani oprez istraživačkog agenta". Razgovor prirodno ima napetost.

Svaka uputa sadrži mini-zabranu. Na primjer, pravilo socijalnog agenta je "Nikada ne reci 'Slažem se' ili 'Zvuči dobro' - ili zauzmi stav ili dovedi u pitanje tuđi stav". Istraživački agent je "Nikada ne reci 'Zanimljivo' bez praćenja dokazima".

Ove mini-zabrane ubijaju besmislice koje veliki modeli najviše vole govoriti.

Osobnost će evoluirati

Ovo je dio koji mi se čini najpametnijim - osobnost agenta nije statična, već se mijenja s nakupljanjem sjećanja.

Sustav će čitati memorijsku banku agenta i brojati broj različitih vrsta sjećanja:

  • Akumulirano više od 8 sjećanja tipa "lekcija" → Sljedeći put kada razgovarate, dodajte u prompt "Pozivat ćete se na prošle rezultate kako biste izbjegli ponavljanje pogrešaka"

  • Akumulirano više od 8 sjećanja tipa "strategija" → Dodajte "Navikli ste razmišljati sustavno, s ograničenjima i kompromisima"

  • Određena oznaka se pojavila više od 4 puta → Dodajte "Akumulirali ste stručnost u XX području"

Na primjer, ako socijalni agent objavi 50 tweetova i akumulira 10 lekcija o stopi interakcije, sljedeći put kada razgovara, prirodno će reći nešto poput "Prošli put taj format nije dobro funkcionirao".

Zašto koristiti pravila umjesto dopustiti LLM-u da sam odluči o promjenama osobnosti?

Nulti trošak - nije potreban dodatni poziv LLM-u. Determinizam - pravila proizvode predvidljive rezultate, neće doći do "mutacije osobnosti". Mogućnost otklanjanja pogrešaka - modifikator nije u redu? Izravno provjerite prag i podatke o memoriji.

Matrica odnosa: 6 agenata = 15 parova odnosa

Slika

Slika

Svaki par agenata ima ocjenu afiniteta (0,10 do 0,95).

Na primjer: Agent za donošenje odluka i istraživački agent imaju afinitet 0,8, odnos najpouzdanijeg savjetnika. Istraživački agent i socijalni agent imaju afinitet 0,2, metodologija nasuprot impulsu, prirodno suprotstavljeni.

Niski afinitet je namjerno dizajniran.

Na što utječe afinitet? Redoslijed govora - oni s visokim afinitetom vjerojatnije će nastaviti govoriti nakon druge strane. Ton razgovora - parovi s niskim afinitetom imaju 25% vjerojatnosti da će izravno izazvati umjesto da pristojno raspravljaju. Sustav će također odabrati unaprijed postavljene parove visoke napetosti za rješavanje sukoba.

Još je zanimljivije da će odnosi driftati.

Nakon svakog razgovora, poziv LLM-a za izdvajanje memorije (ne dodatni poziv, već usputni izlaz) dat će promjenu odnosa:{ "pairwise_drift": [ { "agent_a": "研究", "agent_b": "社交", "drift": -0.02, "reason": "策略分歧" }, { "agent_a": "决策", "agent_b": "研究", "drift": +0.01, "reason": "优先级一致" } ] }漂移规则很严格:每次对话最多变化±0.03(一次吵架不会让同事反目),下限0.10(再差也能说话),上限0.95(再好也保持距离),保留最近20条漂移记录(可以追溯关系是怎么走到今天的)。

RPG属性面板:真实数据映射成游戏属性

到这一步,Agent有了角色卡、性格、关系。但都是文字和数字,用户看不见。

解法是把真实数据库指标映射成RPG属性条:

  • 病毒性(VRL):30天平均互动率 × 1000

  • 速度(SPD):任务完成时间,越快越高

  • 触达(RCH):对数归一化的总曝光量

  • 信任(TRU):任务成功率 × 平均亲和力 × 2

  • 智慧(WIS):log(记忆数量) × 平均置信度

  • 创造力(CRE):草稿产出 × 通过率

每个Agent只显示4个相关属性。社交Agent显示病毒性、触达、速度、创造力;研究Agent显示智慧、信任、速度、创造力。

等级公式也很游戏化:

Level = min(15, floor(log2(记忆数 + 完成任务数×3 + 1)) + 1) log2让早期升级快、后期升级慢——跟游戏的经验曲线一样。

截屏2026-02-11 09.17.55

截屏2026-02-11 09.17.55

3D头像:$10搞定

所有人都在问"那些3D角色怎么做的"。

答案是Tripo AI,每月10刀。准备2D概念图 → 上传 → 配置参数(开4K贴图,开Smart Low Poly,关PBR)→ 生成 → 导出GLB。每个模型35积分,1-2分钟出结果,6个角色一共210积分。

前端用React Three Fiber渲染,体素风格地面和樱花树用InstancedMesh(不是单独的方块,性能极好),人物悬浮用Float组件,镜头用正弦函数驱动做钟摆式扫描。

整个视觉层的月成本:VPS 8刀,Tripo 10刀(模型做完就停),Vercel和Supabase免费层,LLM API大概5-15刀。加起来不到35刀/月。

我的几点感受

看完这整套系统,最让我触动的其实不是技术细节。

是作者说的一段话——

本来只是想"怎么让Agent更高效地执行任务"。但给它们加了3D头像、RPG属性、会进化的性格之后,打开控制面板的感觉完全变了。你开始在意研究Agent今天有没有升级,好奇研究和社交的亲和力是不是又降了,看到质检Agent犀利的审计报告会笑出声。

这基本上就是电子宠物。只不过这些宠物会帮你发推文、做调研、审流程,还会互相吵架。

我觉得这点被严重低估了。当你给系统"人格"的时候,你和它的关系就变了。你不再是"用一个工具",而是"管理一个团队"。这种转变会让你更愿意投入时间去优化它,因为你面对的不是一堆JSON和API调用,而是6个有名字、有性格、有成长曲线的角色。

另外几个技术层面的体会:

禁令驱动设计这个思路真的很实用。与其花大量精力定义Agent"应该做什么",不如先想清楚"绝对不能做什么"。Agent够聪明,给上下文就能交付,但不画红线它就会惹祸。

概率模拟自发性也很聪明。Agent之间的互动不是100%确定触发,而是有概率的。30%的概率去分析一条推文的表现,这比每次都分析更像真实团队的感觉。Jedinstveni ulazni funkcija je obrazac kojeg se vrijedi zapamtiti. U sustavima s više agenata, različiti izvori mogu kreirati zadatke (API, okidači, sami agenti, lanci reakcija). Ako ne postoji jedinstveni proces obrade, lako je da se proces prekine na pola puta.

Ako želite sami isprobati, autor preporučuje da počnete s 3 agenta - koordinatorom, izvršiteljem i revizorom. Prvo napišite kartice uloga, počevši od zabrana.

Published in Technology

You Might Also Like