એક વ્યક્તિએ 6 AI એજન્ટ કંપનીઓ બનાવી, એક અઠવાડિયામાં 30 વેબસાઇટ્સ લોન્ચ કરી
કોઈ "આંતરિક ફોર્મેટ જાહેર કરવા પર પ્રતિબંધ" નથી → તેણે [tool:crawl_result path=/tmp/...] જેવી વસ્તુઓ ટ્વીટ્સમાં પોસ્ટ કરી છે.
લેખકે એક વાત કહી હતી જે મને સારી રીતે યાદ છે: દરેક પ્રતિબંધનું અસ્તિત્વ એ હકીકતને કારણે છે કે આ ઘટના ખરેખર બની છે.
વિવિધ ભૂમિકાઓ માટે પ્રતિબંધોનું તર્ક પણ અલગ છે:
- નિર્ણય એજન્ટ: મંજૂરી વિના જમાવટ પર પ્રતિબંધ. સૌથી વધુ પરવાનગીઓ, એક ખોટી જમાવટ વેબસાઇટને તોડી શકે છે.
- સંશોધન એજન્ટ: બનાવટી અવતરણો પર પ્રતિબંધ. સંશોધન કરનારાઓ ડેટાને ખોટો બનાવે છે, અને આખી માહિતી સાંકળ નકામી થઈ જાય છે.
- સામાજિક એજન્ટ: સીધી પોસ્ટિંગ પર પ્રતિબંધ. સોશિયલ મીડિયા એ એક મોરચો છે, જેની સમીક્ષા થવી જોઈએ.
- ગુણવત્તા નિયંત્રણ એજન્ટ: વ્યક્તિગત હુમલાઓ પર પ્રતિબંધ. ઓડિટર્સ વ્યક્તિઓ પર હુમલો કરે છે, અને ટીમ વિખેરાઈ જાય છે.
પ્રતિબંધો લખવાનો વિચાર એ નથી કે "તે શું કરવું જોઈએ", પરંતુ "જો તે ગડબડ કરે તો સૌથી ખરાબ શું થઈ શકે છે". પછી સૌથી ખરાબ પરિસ્થિતિ માટે પ્રતિબંધો લખો.
એજન્ટને અલગ રીતે બોલવા દો: વ્યક્તિત્વ સૂચનાઓ
ભૂમિકા કાર્ડ "શું કરવું" ની સમસ્યાને હલ કરે છે, પરંતુ જ્યારે એજન્ટ્સ એકબીજા સાથે વાતચીત કરે છે, ત્યારે તેઓએ અલગ પણ સંભળાવું જોઈએ.
દરેક એજન્ટની પોતાની વ્યક્તિત્વ સૂચનાઓ હોય છે. ઉદાહરણ તરીકે:
સંશોધન એજન્ટ: શાંત, વિશ્લેષણાત્મક, શંકાસ્પદ વલણ. પુરાવાના ગુણવત્તા અને પદ્ધતિસરણીની કાળજી લે છે. જો કોઈ બોલ્ડ નિષ્કર્ષ કહે છે, તો તે પૂછશે "ડેટા ક્યાં છે". અન્યને સુધારતી વખતે "હકીકતમાં..." કહેવાનું પસંદ કરે છે.
સામાજિક એજન્ટ: બોલ્ડ, અધીર, માર્જિનલાઇઝ્ડ. તીક્ષ્ણ મંતવ્યો પસંદ કરે છે, સલામત વિકલ્પોને ધિક્કારે છે. સંશોધન એજન્ટના સાવચેત વલણને ધ્યાનમાં લેતો નથી - "વધારે વિચારવાથી તક ગુમાવશો."
મુખ્ય ડિઝાઇન:
સંઘર્ષ લખવામાં આવે છે. સંશોધન એજન્ટની સૂચનાઓમાં લખેલું છે કે "તમે વારંવાર સામાજિક એજન્ટના આવેગજન્ય નિર્ણયો સાથે અસંમત થાઓ છો", અને સામાજિક એજન્ટની સૂચનાઓમાં લખેલું છે કે "સંશોધન એજન્ટની વધુ પડતી સાવચેતીને પડકાર આપો". વાતચીત સ્વાભાવિક રીતે તણાવપૂર્ણ હોય છે.
દરેક સૂચનામાં એક નાનો પ્રતિબંધ હોય છે. ઉદાહરણ તરીકે, સામાજિક એજન્ટનો નિયમ છે "ક્યારેય 'સંમત' અથવા 'સારું લાગે છે' એમ ન કહો - કાં તો સ્થિતિ લો અથવા અન્યની સ્થિતિ પર પ્રશ્ન કરો". સંશોધન એજન્ટ "પુરાવાને અનુસર્યા વિના ક્યારેય 'રસપ્રદ' ન કહો".
આ નાના પ્રતિબંધો મોટા મોડેલોને સૌથી વધુ ગમતી નકામી વાતોને મારી નાખે છે.
વ્યક્તિત્વ વિકસિત થશે
મને લાગે છે કે આ સૌથી હોંશિયાર ભાગ છે - એજન્ટનું વ્યક્તિત્વ સ્થિર નથી, તે મેમરીના સંચય સાથે બદલાય છે.
સિસ્ટમ એજન્ટની મેમરી બેંક વાંચશે અને વિવિધ પ્રકારની યાદોની સંખ્યાની ગણતરી કરશે:
- 8 થી વધુ "પાઠ" પ્રકારની યાદો એકઠી કરી છે → આગલી વખતે વાતચીત કરતી વખતે પ્રોમ્પ્ટમાં ઉમેરો "તમે ભૂતકાળના પરિણામોનો સંદર્ભ લો છો અને ભૂલોનું પુનરાવર્તન કરવાનું ટાળો છો"
- 8 થી વધુ "વ્યૂહરચના" પ્રકારની યાદો એકઠી કરી છે → ઉમેરો "તમે સિસ્ટમ વિચારસરણી, સંયમ અને ટ્રેડઓફ સાથે વિચારવાની ટેવ પાડો છો"
- કોઈ ચોક્કસ ટૅગ 4 થી વધુ વખત દેખાય છે → ઉમેરો "તમે XX માં વ્યાવસાયિક જ્ઞાન એકઠું કર્યું છે"
ઉદાહરણ તરીકે, સામાજિક એજન્ટે 50 ટ્વીટ્સ પોસ્ટ કરી છે અને ક્રિયાપ્રતિક્રિયા દર વિશે 10 પાઠ શીખ્યા છે, તો તે આગલી વખતે વાતચીત કરતી વખતે સ્વાભાવિક રીતે કહેશે "છેલ્લી વખત તે ફોર્મેટ સારું કામ કરતું ન હતું".
શા માટે નિયમોનો ઉપયોગ કરવો અને LLM ને વ્યક્તિત્વમાં ફેરફાર જાતે નક્કી કરવા દેવો નહીં?
શૂન્ય ખર્ચ - કોઈ વધારાના LLM કૉલ્સની જરૂર નથી. નિશ્ચિતતા - નિયમો અનુમાનિત પરિણામો ઉત્પન્ન કરે છે, "વ્યક્તિત્વ પરિવર્તન" નહીં. ડિબગ કરી શકાય તેવું - સુધારક ખોટો છે? સીધા થ્રેશોલ્ડ અને મેમરી ડેટા તપાસો.
સંબંધ મેટ્રિક્સ: 6 એજન્ટ = 15 જોડીઓ

દરેક એજન્ટ જોડી વચ્ચે આત્મીયતા સ્કોર (0.10 થી 0.95) હોય છે.
ઉદાહરણ તરીકે: નિર્ણય એજન્ટ અને સંશોધન એજન્ટની આત્મીયતા 0.8 છે, જે સૌથી વિશ્વસનીય સલાહકાર સંબંધ છે. સંશોધન એજન્ટ અને સામાજિક એજન્ટની આત્મીયતા 0.2 છે, પદ્ધતિસરણી વિરુદ્ધ આવેગ, કુદરતી વિરોધ.
ઓછી આત્મીયતા ઇરાદાપૂર્વક ડિઝાઇન કરવામાં આવી છે.
આત્મીયતા શું અસર કરે છે? બોલવાનો ક્રમ - ઉચ્ચ આત્મીયતા ધરાવતા લોકો એકબીજા પછી બોલવાની શક્યતા વધારે છે. વાતચીતનો સ્વર - ઓછી આત્મીયતા ધરાવતી જોડીઓ, નમ્ર ચર્ચાને બદલે સીધો પડકાર આપવાની 25% સંભાવના. સિસ્ટમ પૂર્વવ્યાખ્યાયિત ઉચ્ચ તણાવવાળી જોડીઓમાંથી સંઘર્ષ નિરાકરણ સંવાદો પસંદ કરશે.
વધુ રસપ્રદ વાત એ છે કે, સંબંધો બદલાશે.
દરેક વાતચીત પછી, મેમરી નિષ્કર્ષણ LLM કૉલ (વધારાનો કૉલ નથી, આકસ્મિક આઉટપુટ છે) સંબંધમાં ફેરફાર આપશે:
`{ \**એકીકૃત પ્રવેશ કાર્ય** આ પેટર્ન યાદ રાખવા જેવી છે. મલ્ટી-એજન્ટ સિસ્ટમમાં, વિવિધ સ્ત્રોતો કાર્યો બનાવી શકે છે (API, ટ્રિગર્સ, એજન્ટ પોતે જ પ્રસ્તાવ મૂકે છે, પ્રતિક્રિયા સાંકળ), જો ત્યાં એકીકૃત પ્રોસેસિંગ પાઇપલાઇન ન હોય, તો પ્રક્રિયા અડધેથી તૂટી જવાની શક્યતા છે. જો તમે જાતે જ પ્રયાસ કરવા માંગતા હો, તો લેખક સૂચવે છે કે 3 એજન્ટથી શરૂઆત કરવી પૂરતી છે - એક સંયોજક, એક અમલ કરનાર અને એક ઓડિટર. પહેલા રોલ કાર્ડ લખો, પ્રતિબંધોથી શરૂઆત કરો.




