Una persona crea 6 empreses d'agents d'IA i posa en marxa 30 llocs web en una setmana

2/13/2026
8 min read

Recentment he vist el que ha fet un desenvolupador independent i m'ha deixat sense paraules.

6 agents d'IA, gestionant un lloc web sencer per si mateixos. Reunions automàtiques diàries, votacions, redacció de contingut, publicació de tuits, control de qualitat. Tot automàtic, sense que ningú ho supervisi.

No és una demostració, està funcionant realment en línia.

截屏2026-02-11 09.13.32截屏2026-02-11 09.13.32

Però el que més m'ha obsessionat no és l'arquitectura de bucle tancat, sinó que ha dissenyat un "sistema de personalitat" complet per a cada agent. Amb personalitat, relacions, corba de creixement i fins i tot panells d'atributs RPG i avatars 3D.

Per ser sincer, la meva primera reacció després de veure-ho va ser: no és això una mascota electrònica? Només que aquestes mascotes t'ajudaran a tuitejar, fer investigacions, escriure informes i fins i tot barallar-se entre elles.

Avui desglossarem tot aquest disseny per parlar-ne, i els amics que facin sistemes multi-agent haurien de tenir molta inspiració.

Repassem ràpidament l'arquitectura

El conjunt de tres peces de la pila tecnològica: OpenClaw s'executa en un VPS com a cervell, Next.js + Vercel fan el frontend i la capa API, i Supabase emmagatzema tots els estats.

Els 6 agents tenen diferents divisions del treball: alguns prenen decisions, alguns fan investigacions, alguns recopilen informació, alguns escriuen contingut, alguns gestionen les xarxes socials i alguns fan el control de qualitat.

El treball cron d'OpenClaw els fa "fitxar" diàriament, i la funció de taula rodona els permet discutir i votar.

Però des de "poder parlar" fins a "poder treballar", hi ha tot un bucle tancat al mig. L'autor va ensopegar amb tres grans problemes abans que funcionés, aquí ho explicaré breument:

Problema 1: VPS i Vercel competeixen per les tasques al mateix temps. Dos executors consulten la mateixa taula, i les condicions de carrera condueixen directament a conflictes d'estat de la tasca. La solució és tallar un costat, el VPS s'encarrega de l'execució i Vercel només fa el pla de control.

Problema 2: El disparador pot detectar condicions i crear propostes, però les propostes sempre es queden pendents. Perquè el disparador insereix directament dades a la taula, saltant-se el procés posterior d'aprovació i creació de tasques. La solució és extreure una funció d'entrada unificada, i totes les rutes per crear propostes passen per la mateixa.

Problema 3: La quota s'ha esgotat, però les tasques en cua encara s'acumulen frenèticament. El treballador veu que la quota està plena i se la salta, sense reclamar-la ni marcar-la com a fallida, i amb el temps s'acumulen centenars de passos a la base de dades que mai s'executaran. La solució és comprovar la quota a l'entrada de la proposta, i si està plena, rebutjar-la directament, impedint que generi tasques en cua.

El nucli dels tres problemes és el mateix: bloquejar-ho a la porta, no deixar que el problema entri a la cua.

Després que el bucle tancat funcioni, la part interessant comença realment.

Targeta de rol: no és una frase, és un "manual d'empleat" complet

Tothom que fa sistemes multi-agent sap que si li dius a Claude "ets el gestor de xarxes socials", realment tuitejarà. Però si executeu 6 agents com aquest al mateix temps, trobareu que:

  • Tots parlen amb el mateix to

  • No saben què no haurien de fer

  • Qui treballa bé amb qui i qui entra en conflicte amb qui depèn de la sort

  • Mai canviaran el seu comportament a causa de l'experiència acumulada

Aquest desenvolupador ha dissenyat 6 capes de targetes de rol per a cada agent:

Domain → De què ets responsable Inputs/Outputs → De qui agafes coses i a qui les lliures Definition of Done → Què significa "fet" Hard Bans → Què no pots fer absolutament Escalation → Quan has de parar i demanar instruccions Metrics → Els teus KPI Prenent com a exemple l'agent de xarxes socials, la seva targeta de rol defineix: només és responsable de la distribució de contingut, les entrades provenen de l'escriptura d'esborranys d'agents i material d'agents d'intel·ligència, les sortides són esborranys de tuits i plans de publicació, la prohibició estricta és publicar directament tuits (només pot escriure esborranys), prohibir la fabricació de dades i prohibir la divulgació de formats interns.

Totes les capes estan fent el mateix: reduir l'espai de comportament de l'agent.

Les prohibicions són un milió de vegades més importants que les habilitats

Aquesta és la visió més essencial de tot el disseny.

No necessites ensenyar a un LLM a escriure tuits: Claude, GPT i Gemini són prou intel·ligents. Doneu-li context i pot lliurar. El que necessites dir-li és: què no pot fer absolutament.

Sense "prohibició de publicar directament" → L'agent social crida directament l'API de Twitter, saltant-se totes les aprovacions.

Sense "prohibició de fabricar números" → Escriurà al tuit "La taxa d'interacció ha augmentat un 340%", d'on provenen aquests números? Fabricats.Sense un "prohibició de divulgació de formats interns" → Envia coses com [tool:crawl_result path=/tmp/...] a tuits.

L'autor va dir una frase que recordo molt bé: Cada prohibició existeix perquè realment ha passat.

La lògica de les prohibicions també és diferent per a cada rol:

  • Agent de decisió: Prohibit el desplegament sense aprovació. Té la màxima autoritat, un desplegament erroni pot fer caure el lloc web

  • Agent d'investigació: Prohibit inventar cites. Si algú que fa investigació falsifica dades, tota la cadena d'informació es perd

  • Agent social: Prohibit publicar directament. Les xarxes socials són la façana, han de ser aprovades

  • Agent de control de qualitat: Prohibit l'atac personal. Si un auditor ataca una persona, l'equip es desfà

La idea d'escriure prohibicions no és "què hauria de fer", sinó "què és el pitjor que podria passar si ho fa malament". I després escriure prohibicions per al pitjor escenari.

Fer que els agents parlin de manera diferent: instruccions de personalitat

La targeta de rol resol el problema de "què fer", però quan els agents dialoguen entre ells, també necessiten sonar diferent.

Cada agent té instruccions de personalitat separades. Per exemple:

Agent d'investigació: Calmat, analític, escèptic. Es preocupa per la qualitat de l'evidència i la metodologia. Si algú diu una conclusió audaç, preguntarà "On són les dades". Quan corregeix als altres, li agrada dir "En realitat..."

Agent social: Audaz, impacient, marginal. Li agraden els punts de vista aguts, odia les cartes segures. No està d'acord amb l'actitud cautelosa de l'agent d'investigació: "Pensar massa et farà perdre l'oportunitat."

Disseny clau:

El conflicte està escrit. Les instruccions de l'agent d'investigació diuen "Sovint no estàs d'acord amb les decisions impulsives de l'agent social", i les instruccions de l'agent social diuen "Desafia la cautela excessiva de l'agent d'investigació". El diàleg és naturalment tens.

Cada instrucció té una micro-prohibició. Per exemple, la regla de l'agent social és "Mai diguis 'Estic d'acord' o 'Sembla bé' - o pren una posició o qüestiona la posició dels altres". L'agent d'investigació és "Mai diguis 'Interessant' sense fer un seguiment de l'evidència".

Aquestes micro-prohibicions eliminen les tonteries que els models grans els encanta dir.

La personalitat evolucionarà

Aquesta és la part que em sembla més intel·ligent: la personalitat de l'agent no és estàtica, canviarà amb l'acumulació de memòria.

El sistema llegirà la base de dades de memòria de l'agent i comptarà el nombre de diferents tipus de memòria:

  • Ha acumulat més de 8 memòries de tipus "lliçó" → Afegeix una línia a l'indicador la propera vegada que dialoguis "Referenciaràs els resultats passats per evitar repetir els mateixos errors"

  • Ha acumulat més de 8 memòries de tipus "estratègia" → Afegeix una línia "Estàs acostumat a pensar amb pensament sistèmic, restriccions i compromisos"

  • Una etiqueta apareix més de 4 vegades → Afegeix una línia "Has acumulat coneixements especialitzats en XX"

Per exemple, si l'agent social publica 50 tuits i acumula 10 lliçons sobre la taxa d'interacció, la propera vegada que dialogui, dirà naturalment coses com "L'últim format no va funcionar bé".

Per què utilitzar regles en lloc de deixar que el LLM decideixi per si mateix els canvis de personalitat?

Cost zero: no es necessiten trucades LLM addicionals. Determinació: les regles produeixen resultats predictibles, no "mutacions de personalitat". Depurable: el modificador no és correcte? Comprova directament el llindar i les dades de memòria.

Matriu de relacions: 6 agents = 15 parelles de relacions

Imatge

Imatge

Cada parell d'agents té una puntuació d'afinitat (de 0,10 a 0,95).

Per exemple: l'agent de decisió i l'agent d'investigació tenen una afinitat de 0,8, la relació de consultor més fiable. L'agent d'investigació i l'agent social tenen una afinitat de 0,2, metodologia vs impuls, oposició natural.

La baixa afinitat està dissenyada intencionadament.

Què afecta l'afinitat? Ordre de paraula: és més probable que els que tenen una alta afinitat parlin després de l'altra part. Tonalitat de la conversa: en parelles de baixa afinitat, hi ha un 25% de probabilitats que hi hagi un desafiament directe en lloc d'una discussió educada. El sistema també triarà parelles preestablertes d'alta tensió per dur a terme diàlegs de resolució de conflictes.

El que és més interessant és que les relacions es desviaran.

Després de cada diàleg, la trucada LLM d'extracció de memòria (no una trucada addicional, és una sortida incidental) donarà un canvi de relació:`{ **La funció d'entrada unificada** és un patró que val la pena recordar. En un sistema multi-Agent, diverses fonts poden crear tasques (API, activadors, el mateix Agent, cadenes de reacció), si no hi ha un conducte de processament unificat, el flux pot interrompre's fàcilment a mig camí.

Si vols provar-ho tu mateix, l'autor suggereix començar amb 3 Agents: un coordinador, un executor i un auditor. Comença escrivint les targetes de rol, començant per les prohibicions.

Published in Technology

You Might Also Like