En človek je ustvaril 6 podjetij z AI agenti in v enem tednu lansiral 30 spletnih strani
Avtor je rekel nekaj, kar si zelo dobro zapomnim: Vsaka prepoved obstaja, ker se je ta stvar res zgodila.
Logika prepovedi se razlikuje glede na vlogo:
- Agent za odločanje: Prepovedana je uvedba brez odobritve. Ima najvišjo raven dovoljenj, ena sama napačna uvedba lahko uniči spletno mesto.
- Raziskovalni agent: Prepovedano je izmišljevanje citatov. Če raziskovalec ponareja podatke, je celotna informacijska veriga uničena.
- Socialni agent: Prepovedana je neposredna objava. Socialni mediji so izložba, ki mora biti odobrena.
- Agent za nadzor kakovosti: Prepovedani so osebni napadi. Če revizor napade posameznika, se ekipa razide.
Pri pisanju prepovedi ne gre za "kaj bi moral storiti", temveč za "kaj je najhujše, kar se lahko zgodi, če ga zafrkne". Nato napišite prepoved glede na najhujši možni scenarij.
Naj agenti govorijo drugače: navodila za osebnost
Kartica z vlogo rešuje vprašanje "kaj storiti", vendar morajo agenti pri pogovoru med seboj zveneti drugače.
Vsak agent ima ločena navodila za osebnost. Na primer:
Raziskovalni agent: Miren, analitičen, skeptičen. Zanima ga kakovost dokazov in metodologija. Če nekdo izreče drzen zaključek, bo vprašal "Kje so podatki?". Pri popravljanju drugih rad reče "Pravzaprav..."
Socialni agent: Drzen, nestrpen, marginalen. Všeč so mu ostre ideje, sovraži varne poteze. Ne verjame v previdnost raziskovalnega agenta - "Preveč razmišljanja zamudi priložnost."
Ključna zasnova:
Konflikt je zapisan v kodo. V navodilih raziskovalnega agenta piše "Pogosto se ne strinjate z impulzivnimi odločitvami socialnega agenta", v navodilih socialnega agenta pa piše "Izzovite pretirano previdnost raziskovalnega agenta". Pogovor je seveda napet.
Vsako navodilo vsebuje mini prepoved. Na primer, pravilo socialnega agenta je "Nikoli ne recite 'strinjam se' ali 'zveni dobro' - bodisi zavzemite stališče bodisi izzivajte stališče drugih". Raziskovalni agent je "Nikoli ne recite 'zanimivo', ne da bi navedli dokaze."
Te mini prepovedi ubijejo nesmiselne besede, ki jih ima veliki model najraje.
Osebnost se bo razvijala
To se mi zdi najbolj pameten del - osebnost agenta ni statična, ampak se spreminja z nabiranjem spominov.
Sistem bo prebral spominsko bazo agenta in statistično obdelal število različnih vrst spominov:
- Nabralo se je več kot 8 spominov vrste "lekcija" → naslednjič, ko se pogovarjate, dodajte v poziv "Sklicevali se boste na pretekle rezultate, da se izognete ponavljanju napak"
- Nabralo se je več kot 8 spominov vrste "strategija" → dodajte "Navajeni ste razmišljati s sistemskim razmišljanjem, omejitvami in kompromisi"
- Določena oznaka se pojavi več kot 4-krat → dodajte "Nabrali ste strokovno znanje na področju XX"
Na primer, če socialni agent objavi 50 tvitov in nabere 10 lekcij o stopnji interakcije, bo naslednjič, ko se bo pogovarjal, naravno rekel "Prejšnja oblika ni delovala dobro."
Zakaj uporabljati pravila, namesto da bi LLM sam odločal o spremembah osebnosti?
Ničelni stroški - ne potrebujete dodatnih klicev LLM. Gotovost - pravila dajejo predvidljive rezultate, ne bo "nenadne spremembe osebnosti." Možnost odpravljanja napak - modifikator ni pravilen? Preverite neposredno prag in podatke o spominu.
Matrika odnosov: 6 agentov = 15 parov odnosov

Slika
Vsak par agentov ima oceno afinitete (od 0,10 do 0,95).
Na primer: Agent za odločanje in raziskovalni agent imata afiniteto 0,8, kar je najbolj zaupanja vreden odnos svetovalca. Raziskovalni agent in socialni agent imata afiniteto 0,2, metodologija proti impulzivnosti, naravno nasprotje.
Nizka afiniteta je namenoma zasnovana.
Kaj vpliva na afiniteto? Vrstni red govora - tisti z visoko afiniteto bodo verjetneje nadaljevali s govorom drugega. Ton pogovora - pri parih z nizko afiniteto obstaja 25-odstotna verjetnost neposrednega izziva namesto vljudne razprave. Sistem bo izbral tudi vnaprej določene pare z visoko napetostjo za reševanje konfliktov.
Še bolj zanimivo je, da se bodo odnosi spreminjali.
Po vsakem pogovoru bo klic LLM za pridobivanje spomina (ne dodaten klic, ampak stranski izhod) dal spremembo odnosa:
`{ \**Enotna vstopna točka funkcije** je vzorec, ki si ga je vredno zapomniti. V sistemu z več agenti lahko različni viri ustvarjajo naloge (API, sprožilci, agenti sami, reakcijske verige). Če ni enotnega procesiranja, se lahko proces prekine na pol poti. Če želite poskusiti sami, avtor priporoča, da začnete s 3 agenti - koordinatorjem, izvajalcem in revizorjem. Najprej napišite kartice vlog, začenši s prepovedmi.




