Vai vēlaties saprast Codex aģentu? Šo padziļināto analīzi nedrīkst palaist garām!

OpenAI tikko izdarīja kaut ko "neparastu".

Parasti OpenAI publicē spēcīgākus modeļus (piemēram, o1), bet šoreiz viņi publicēja padziļinātu tehnisko emuāru ierakstu "Unrolling the Codex agent loop", ne tikai atvēra Codex CLI galveno loģiku, bet arī soli pa solim izjauca, kā darbojas nobriedis koda aģents (Coding Agent).

Codex CLI

Laikā, kad Claude Code un Cursor traki piesaista fanus, šis OpenAI raksts ir ne tikai muskuļu demonstrēšana, bet arī "Agentu arhitektu ceļvedis, lai izvairītos no kļūdām". Neatkarīgi no tā, vai vēlaties labi izmantot AI programmēšanas rīkus vai vēlaties izstrādāt savu aģentu, šis raksts ir vērts rūpīgi izlasīt.

Visā tekstā ir vairāk nekā 8300 vārdu, un lasīšana aizņems apmēram 20 minūtes.

Pirmkārt, kas ir Codex CLI?

Codex CLI ir OpenAI izstrādāts atvērtā koda kodēšanas aģenta rīks, ko var palaist lokālajā datorā vai instalēt koda redaktorā. Atbalsta VS Code, Cursor, Windsurf utt.

Atvērtā koda adrese: https://github.com/openai/codex

Codex CLI saskarne

Un Agent Loop (aģenta cilpa), kas tiks ieviesta šoreiz, ir Codex CLI galvenā loģika: tā ir atbildīga par lietotāju, modeļu un modeļu zvanu koordinēšanu, lai veiktu vērtīgu mijiedarbību starp rīkiem.

Agent Loop (inteliģentā aģenta cilpa)

Modelis ir tikai komponents, tikai aģents (Agent) var veidot produktu.

Katram AI aģentam pamatā ir tā sauktā "inteliģentā aģenta cilpa (Agent Loop)". Inteliģentā aģenta cilpas shēma ir parādīta zemāk:

Agent Loop shēma

Mēs parasti domājam, ka AI programmēšana ir: "Es jautāju, tas atbild". Bet Codex CLI iekšienē tas ir sarežģīts bezgalīgs cikls...

Standarta Agent Loop ietver šādas saites:

Lietotāja norādījumi: lietotāja ievadītu teksta norādījumu kopa (piemēram, "refaktorējiet šo funkciju").
Modeļa secinājumi: modelis izlemj, vai atbildēt tieši, vai izsaukt rīku (Tool Call).
Rīka izsaukums: ja modelis nolemj izsaukt list files vai run shell, CLI lokāli izpildīs šīs komandas.
Novērojums (Observation): tiek uztverts rīka izpildes rezultāts (kods, kļūdas, failu saraksts).
Cikls: šie rezultāti tiek pievienoti sarunu vēsturei un atkal ievadīti modelim. Pēc rezultātu redzēšanas modelis izlemj nākamo darbību.
Beigas: līdz modelis uzskata, ka uzdevums ir pabeigts, un izvada galīgo atbildi.

Visu procesu no "lietotāja ievades" līdz "inteliģentā aģenta atbildei" sauc par sarunas kārtu (Codex to sauc par pavedienu).

Vairāku kārtu aģenta cilpa

Sarunai turpinoties, palielināsies arī uzvednes (Prompt) garums, ko izmanto modeļa secinājumiem. Šis garums ir svarīgs, jo katram modelim ir konteksta logs, kas atspoguļo maksimālo žetonu skaitu (tokens), ko modelis var izmantot vienā secinājumu izsaukumā.

Modeļa secinājumi

Codex CLI nosūta HTTP pieprasījumu uz Responses API, lai veiktu modeļa secinājumus. Codex izmanto Responses API, lai vadītu aģenta cilpu.

Kas ir Responses API?

Responses API ir jaunās paaudzes inteliģento aģentu izstrādes saskarne, ko OpenAI ieviesa 2025. gada martā, un tās mērķis ir apvienot sarunu, rīku izsaukumu un multimodālu apstrādes iespējas, lai nodrošinātu izstrādātājiem elastīgāku un jaudīgāku AI lietojumprogrammu izveides pieredzi.

Codex CLI izmantotais Responses API punkts ir konfigurējams, un to var izmantot ar jebkuru punktu, kas ievieš Responses API.

Uzvednes izveides process

Modelis veic paraugu ņemšanu (ģenerē atbildi)

HTTP pieprasījums, kas uzsākts Responses API, sāks Codex sarunas pirmo "kārtu" (turn). Serveris straumēs atbildi, izmantojot Server-Sent Events (SSE).

Turpmākā uzvednes struktūra

Ņemiet vērā, ka iepriekšējās kārtas uzvedne ir precīzs jaunās uzvednes prefikss. Šis dizains var ievērojami uzlabot turpmāko pieprasījumu efektivitāti - var izmantot uzvednes kešatmiņas mehānismu.

Vairāku kārtu sarunu uzvednes pieaugums

Uzvednes nepārtrauktas pagarināšanas ietekme, palielinoties kārtu skaitam

1. Veiktspējas ziņā

Palielinās modeļa paraugu ņemšanas izmaksas: uzvednes nepārtraukta pagarināšana palielinās modeļa paraugu ņemšanas izmaksas, jo paraugu ņemšanas procesā ir jāapstrādā vairāk datu, kas palielina aprēķinu apjomu.
Samazinās kešatmiņas ieguvumi: uzvednei nepārtraukti pagarinoties, palielinoties kārtu skaitam, palielinās grūtības precīzi saskaņot prefiksu, un samazinās kešatmiņas trāpījumu iespējamība.

2. Konteksta loga pārvaldības ziņā

Konteksta logs ir viegli izsmelts: uzvednes nepārtraukta pagarināšana strauji palielinās sarunas atzīmju skaitu, un, tiklīdz tiek pārsniegts konteksta loga slieksnis, konteksta logs var tikt izsmelts.
Palielinās saspiešanas operāciju nepieciešamība: lai izvairītos no konteksta loga izsmelšanas, saruna ir jāsaspiež, kad atzīmju skaits pārsniedz slieksni.

3. Kešatmiņas neatrašanas riska ziņā

Vairākas darbības var viegli izraisīt kešatmiņas neatrašanu: ja uzvednes pagarināšana ietver tādu darbību maiņu kā modeļa pieejamie rīki, mērķa modelis, smilškastes konfigurācija utt., tas vēl vairāk palielinās kešatmiņas neatrašanas risku.
MCP rīki palielina sarežģītību: MCP serveris var dinamiski mainīt piedāvāto rīku sarakstu, un atbildes uz saistītiem paziņojumiem ilgstošās sarunās var izraisīt kešatmiņas neatrašanu.

Atsauces informācija: "Unrolling the Codex agent loop" avots: OpenAI

Vai vēlaties saprast Codex aģentu? Šo padziļināto analīzi nedrīkst palaist garām!

Vai vēlaties saprast Codex aģentu? Šo padziļināto analīzi nedrīkst palaist garām!

Pirmkārt, kas ir Codex CLI?

Agent Loop (inteliģentā aģenta cilpa)

Modeļa secinājumi

Modelis veic paraugu ņemšanu (ģenerē atbildi)

Uzvednes nepārtrauktas pagarināšanas ietekme, palielinoties kārtu skaitam

1. Veiktspējas ziņā

2. Konteksta loga pārvaldības ziņā

3. Kešatmiņas neatrašanas riska ziņā

You Might Also Like

Claude Code Buddy modificēšanas ceļvedis: kā iegūt spīdīgu leģendāro mājdzīvnieku

Obsidian ir izlaidusi Defuddle, pacelot Obsidian Web Clipper uz jauniem augstumiem

OpenAI pēkšņi paziņo par "trīs vienā": pārlūks + programmēšana + ChatGPT apvienošana, iekšēji atzīst, ka pagājušajā gadā tika pieļautas kļūdas

2026, vairs neuzspied sevi "pašdisciplīnai"! Veic šos 8 sīkumus, veselība nāks dabiski

Māmiņas, kas cenšas zaudēt svaru, bet nesasniedz rezultātus, noteikti ir šeit

AI Pārlūka 24 stundu stabilas darbības ceļvedis