Gjithçka është një skedar: Filozofia e dizajnit nga Unix te Agjentët e AI

Origjinal Ethan 业成

cover_image

Jehonë që kapërcen gjysmë shekulli

Qysh në fillim të viteve 1970 në Bell Labs, baballarët e Unix, Ken Thompson dhe Dennis Ritchie, propozuan për herë të parë një parim dizajni të guximshëm deri në ekstrem: Everything is a file - Gjithçka është një skedar.

Më shumë se pesëdhjetë vjet më vonë, kornizat e AI Agent po shpërthejnë. Manus, Claude Code, OpenClaw... Ato vijnë nga ekipe të ndryshme, stiva teknologjike të ndryshme, qëllime të ndryshme biznesi, por të gjitha kanë bërë të njëjtën zgjedhje: ta përdorin sistemin e skedarëve si skeletin njohës të Agjentit.

Manus i jep Agjentit një makinë virtuale, dhe produktet e detyrave ruhen si skedarë. Claude Code lexon dhe shkruan drejtpërdrejt në sistemin lokal të skedarëve të përdoruesit, duke përdorur një skedar CLAUDE.md për të mbajtur të gjitha udhëzimet dhe kontekstin. Kornizat me burim të hapur si OpenClaw gjithashtu organizojnë dekompozimin e detyrave dhe gjendjet e ndërmjetme me një strukturë direktorish.

Kur inxhinierët, të ndarë nga gjysmë shekulli, përballen me probleme teknike krejtësisht të ndryshme, por konvergojnë në mënyrë të pavarur në të njëjtën zgjidhje - kjo nuk është rastësi, por një rezonancë e filozofisë së dizajnit.

Vendimi i Unix

Për të kuptuar peshën e kësaj, duhet të kthehemi te ajo që bëri Unix.

Dizajni i sistemit të skedarëve Unix njihet si një nga dizajnet më elegante në historinë e shkencës kompjuterike. Ai zgjidhi një problem jashtëzakonisht kompleks: si të menaxhohen burime të ndryshme harduerike dhe burime të dhënash me një ndërfaqe të unifikuar dhe të thjeshtë.

Para viteve 1970, sistemet operative funksiononin kështu: nëse doni të lexoni diskun, thirrni ndërfaqen e diskut; nëse doni të lexoni shiritin magnetik, thirrni ndërfaqen e shiritit magnetik; nëse doni të vizitoni terminalin, thirrni ndërfaqen e terminalit. Çdo pajisje ka API-n e vet, dhe çdo API ka semantikën e vet. Nëse keni N pajisje dhe M operacione, kompleksiteti i sistemit është N × M.

Thompson dhe Ritchie bënë diçka që dukej e thjeshtë deri në marrëzi:

Kthejeni gjithçka në skedarë. Përdorni katër folje, open, read, write, close, për të operuar gjithçka.

Kuptimi thelbësor i kësaj është: të gjitha burimet në sistemin operativ - dokumentet, direktoritë, disqet e ngurtë, modemet, tastierat, printerët, madje edhe lidhjet e rrjetit dhe informacioni i proceseve - mund të abstraktohen në një rrjedhë skedarësh (Stream of Bytes).

Kjo do të thotë që ju duhet të mësoni vetëm një grup API-sh - open(), read(), write(), close() - për të operuar të gjitha burimet e kompjuterit.

Që atëherë, kompleksiteti u shemb nga N × M në 4 × 1. Katër folje, një shtresë abstraksioni.

Gjeniu i kësaj nuk qëndron në emrin "skedar", por në një vështrim më të thellë:

Ju nuk keni nevojë të dini se çfarë fshihet pas deskriptorit të skedarit. Ndërfaqja është kontratë.

Një fd (deskriptor skedari) është një dorezë e errët. Ju e lexoni atë me read(), dhe rrjedha e byte-ve del. Sa i përket faktit nëse këta byte vijnë nga sektori i diskut të ngurtë, buferi i kartës së rrjetit apo dalja standarde e një procesi tjetër - ju nuk ju intereson, dhe nuk duhet t'ju interesojë.

Kjo është fuqia e një ndërfaqeje të unifikuar: ajo e bën injorancën një avantazh.

E njëjta pyetje me të cilën përballet Agjenti

Tani le të kthehemi te situata e AI Agent.

Për të përfunduar një detyrë komplekse, një Agjent përballet me një vështirësi befasuese të ngjashme me sistemin operativ të viteve 1970:

Kujtesa e qëndrueshme: Dritarja e kontekstit të LLM-ve është e paqëndrueshme, dhe zinxhiri i të menduarit zhduket me sesionin. Ashtu si kujtesa që rikuperohet pasi një proces del – ju duhet një vend për të ruajtur gjendjen e ndërmjetme, përndryshe çdo bisedë fillon nga e para.
Konteksti progresiv: Detyrat komplekse nuk mund të përfundohen në një hap. Agjenti duhet të grumbullojë gradualisht kontekstin në raunde të shumta arsyetimi, ashtu si një proces Unix transmeton gjendjen midis ekzekutimeve të shumta duke lexuar dhe shkruar skedarë. Sistemi i skedarëve ofron natyrshëm këtë mënyrë pune progresive "shkruaj pak, lexo pak, pastaj shkruaj pak më shumë".
Planifikimi i unifikuar i mjeteve dhe aftësive: Agjenti duhet të thërrasë mjete heterogjene (Tools/Skills) si kërkimi, ekzekutimi i kodit, gjenerimi i imazheve, ashtu si Unix duhet të menaxhojë pajisje heterogjene si disqet, rrjetet, printerët. Ju duhet një shtresë abstraksioni të unifikuar, përndryshe duhet të shkruani një grup të ri logjike integrimi për çdo mjet të ri që lidhni.
Kufijtë e lejeve të Përdorimit të Kompjuterit: Kur një Agjent ka aftësinë të operojë një kompjuter, "çfarë mund të prekë dhe çfarë nuk mund të prekë" bëhet një çështje jete a vdekje. Sistemi i lejeve të skedarëve Unix (rwx) ofron pikërisht modelin e gatshëm të sandbox – drejtoria është kufiri, lejet janë kontrata.

Katër kërkesa. Tingëllojnë të njohura?

Këto janë pikërisht problemet me të cilat u përball sistemi operativ në vitet 1970.

Kujtesa e qëndrueshme – sistemi i skedarëve e zgjidh natyrshëm, shkrimi është qëndrueshmëri. Konteksti progresiv – vetë struktura e drejtorisë ndërtohet në mënyrë inkrementale, mkdir, touch, append, konteksti rritet me skedarin. Planifikimi i unifikuar i mjeteve – thelbi i tubacioneve Unix: stdout i një procesi është stdin i një procesi tjetër, mediumi i ndërmjetëm është rrjedha e byte-ve. E njëjta gjë vlen edhe për zinxhirin e mjeteve të Agjentit: skedari i daljes nga hapi i mëparshëm është skedari i hyrjes për hapin tjetër. Kufijtë e lejeve – lejet rwx të sistemit të skedarëve, sandbox chroot, natyrshëm përcaktojnë "rrethin e aftësive" të Agjentit.

Pra, kur projektuesit e kornizës së Agjentit përballen me pyetjen "ku duhet të vendoset gjendja e punës së Agjentit", përgjigja është pothuajse e paracaktuar: në sistemin e skedarëve. Sepse nuk ka asnjë zgjidhje më të thjeshtë që mund të plotësojë të katër kufizimet në të njëjtën kohë.

Kur një sistem duhet të "menaxhojë ndërveprimin e një numri të madh burimesh heterogjene", keni dy rrugë:

Rruga A: Dizajnoni ndërfaqe të dedikuara për çdo burim. N lloje burimesh × M lloje operacionesh = NM lloje ndërfaqesh. E saktë por shpërthyese.

Rruga B: Gjeni një shtresë abstraksioni mjaft të hollë për të veshur të gjitha burimet me të njëjtën veshje. 4 lloje operacionesh × 1 shtresë abstraksioni. E përafërt por e kombinueshme.

Unix zgjodhi B. Më shumë se pesëdhjetë vjet më vonë, korniza e Agjentit zgjedh përsëri B.

Një shtresë më e thellë: Skedarët janë eksternalizimi i të menduarit

Por nëse ndalemi vetëm në "konvergjencën e zgjidhjeve teknike", do të humbasim diçka më thelbësore.

Kujtoni se si njerëzit vetë i trajtojnë detyrat komplekse.

Ju merrni një projekt të madh, gjëja e parë që bëni nuk është të filloni të punoni, por: të krijoni dosje. Drejtoria rrënjësore e projektit, drejtoritë e nën-detyrave, drejtoritë e materialeve referuese, drejtoritë e daljes. Ju përdorni strukturën e drejtorisë për të dekompozuar detyrën kaotike në njësi të menaxhueshme. Ju përdorni emrat e skedarëve për të emëruar çdo njësi. Ju përdorni përmbajtjen e skedarëve për të regjistruar procesin e të menduarit dhe produktet e ndërmjetme.

Sistemi i skedarëve nuk është vetëm një zgjidhje ruajtjeje. Është mjeti origjinal për eksternalizimin e të menduarit njerëzor.

Ky vështrim shpjegon pse korniza e Agjentit konvergon në sistemin e skedarëve: "të menduarit" e LLM-ve duhet të eksternalizohet – dritarja e tij e kontekstit është e kufizuar, arsyetimi i gjatë duhet të mbështetet në kujtesën e jashtme. Dhe sistemi i skedarëve është pikërisht formati më i përgjithshëm i "kujtesës së jashtme" që njerëzit kanë shpikur ndonjëherë.

Nga kjo pikëpamje, CLAUDE.md i Claude Code nuk është një skedar konfigurimi. Është një kontratë njohëse e eksternalizuar – njerëzit shkruajnë qëllimin në një skedar, Agjenti e lexon skedarin si qëllim. Skedari bëhet shtresa e ndërfaqes midis mendjes njerëzore dhe inteligjencës artificiale.

Kjo është në përputhje të habitshme me filozofinë e tubacioneve Unix:

Shkruani programe për të trajtuar rrjedhat e tekstit, sepse kjo është një ndërfaqe universale.## Kthehu te parimet themelore

Abstraksionet e mëdha nuk vjetërohen, ato thjesht gjejnë raste të reja në fusha të reja.

"Ndërfaqja e unifikuar zgjidh kompleksitetin" nuk është një shpikje e Unix, është një ligj i përjetshëm i dizajnit të sistemit. Unix rastësisht e zbatoi atë me emrin "skedar". AI Agent rastësisht e zbatoi atë përsëri në formën e një "direktori pune".

Sistemi i gjeneratës së ardhshme do të përballet përsëri me të njëjtën zgjedhje: të dizajnohen ndërfaqe të dedikuara për çdo gjë, apo të gjendet një shtresë e hollë, e përgjithshme dhe e kombinueshme abstraksioni?

Nëse historia ka ndonjë mësim për të na dhënë, përgjigja është shkruar prej kohësh pranë /dev/null:

Keep it simple. Make it compose. Everything is a file. (Mbaje të thjeshtë. Bëje të kompozohet. Çdo gjë është një skedar.)

Gjithçka është një skedar: Filozofia e dizajnit nga Unix te Agjentët e AI

Gjithçka është një skedar: Filozofia e dizajnit nga Unix te Agjentët e AI

Jehonë që kapërcen gjysmë shekulli

Vendimi i Unix

E njëjta pyetje me të cilën përballet Agjenti

Një shtresë më e thellë: Skedarët janë eksternalizimi i të menduarit

You Might Also Like

Claude Code Buddy 修改指南：如何获得闪光传说级宠物

Obsidian ka lançuar Defuddle, duke e çuar Obsidian Web Clipper në një nivel të ri

OpenAI papritur shpall "tre në një": shkrimi i shfletuesit + programimi + bashkimi i ChatGPT, brenda pranojnë se vitin e kaluar kanë bërë gabime

2026, mos e detyro veten "disiplinë"! Bëni këto 8 gjëra të vogla, shëndeti do të vijë natyrshëm

Mamat që përpiqen të humbin peshë dhe nuk arrijnë, patjetër që kanë rënë këtu

AI Browser 24-orësh Stabiliteti i Udhëzimeve