Želite da razumete Codex inteligentnog agenta? Ova detaljna analiza se ne sme propustiti!

2/14/2026
4 min read

Želite da razumete Codex inteligentnog agenta? Ova detaljna analiza se ne sme propustiti!

OpenAI je upravo uradio nešto "neuobičajeno".

Obično, OpenAI objavljuje jače modele (kao što je o1), ali ovog puta su objavili detaljan tehnički blog pod nazivom 《Unrolling the Codex agent loop》, ne samo da su otvorili izvorni kod osnovne logike Codex CLI-a, već su i korak po korak rastavili kako zapravo radi zreo agent za kodiranje (Coding Agent).

Codex CLI

U trenutku kada Claude Code i Cursor ludo osvajaju fanove, ovaj članak OpenAI-a nije samo pokazivanje mišića, već i "vodič za arhitekte agenata za izbegavanje zamki". Bez obzira da li želite dobro da koristite AI alate za programiranje ili želite sami da razvijete agenta, ovaj članak vredi pažljivo pročitati.

Ceo tekst ima više od 8300 reči, a čitanje traje oko 20 minuta.

Prvo, šta je Codex CLI?

Codex CLI je alat za kodiranje agenta otvorenog koda koji je proizveo OpenAI, a može se pokrenuti na lokalnom računaru ili instalirati u uređivaču koda. Podržava VS Code, Cursor, Windsurf itd.

Adresa otvorenog koda: https://github.com/openai/codex

Codex CLI界面

Agent Loop (petlja agenta) koji će biti predstavljen ovog puta je osnovna logika Codex CLI-a: odgovoran je za koordinaciju korisnika, modela i poziva modela, kako bi se izvršile interakcije između vrednih alata.

Agent Loop (petlja inteligentnog agenta)

Modeli su samo komponente, agenti (Agent) mogu da čine proizvod.

Osnova svakog AI agenta je takozvana "petlja inteligentnog agenta (Agent Loop)". Dijagram petlje inteligentnog agenta je prikazan u nastavku:

Agent Loop示意图

Mi obično mislimo da je AI programiranje: "Ja pitam, on odgovara". Ali unutar Codex CLI-a, ovo je složen beskonačni proces petlje...

Standardna Agent Loop sadrži sledeće korake:

  • Korisničke instrukcije: Skup tekstualnih instrukcija koje unosi korisnik (na primer, "refaktoriši ovu funkciju").
  • Model Reasoning (rezonovanje modela): Model odlučuje da li će direktno odgovoriti ili pozvati alat (Tool Call).
  • Tool Call (poziv alata): Ako model odluči da pozove list files ili run shell, CLI će izvršiti ove komande lokalno.
  • Observation (opažanje): Rezultati izvršavanja alata (kod, greške, lista datoteka) se hvataju.
  • Loop (petlja): Ovi rezultati se dodaju u istoriju razgovora i ponovo se unose u model. Nakon što model vidi rezultate, odlučuje o sledećem koraku.
  • Termination (prekid): Sve dok model ne smatra da je zadatak završen, izlazi konačni odgovor.

Ceo proces od "korisničkog unosa" do "odgovora inteligentnog agenta" se naziva runda razgovora (u Codex-u se naziva nit).

Multi-turn Agent loop

Kako razgovor napreduje, dužina upita (Prompt) koji se koristi za rezonovanje modela će se takođe povećati. Ova dužina je važna jer svaki model ima kontekstni prozor, koji predstavlja maksimalan broj tokena koje model može da koristi u jednom pozivu za rezonovanje.

Model Reasoning (rezonovanje modela)

Codex CLI šalje HTTP zahteve Responses API-ju za rezonovanje modela. Codex koristi Responses API za pokretanje petlje agenta.

Šta je Responses API?

Responses API je nova generacija interfejsa za razvoj inteligentnih agenata koji je OpenAI lansirao u martu 2025. godine, a ima za cilj da ujedini mogućnosti razgovora, poziva alata i multimodalne obrade, kako bi programerima pružio fleksibilnije i moćnije iskustvo izgradnje AI aplikacija.

Responses API krajnja tačka koju koristi Codex CLI je konfigurabilna i može se koristiti sa bilo kojom krajnjom tačkom koja implementira Responses API.

Prompt构建流程

Model vrši uzorkovanje (generiše odgovor)

HTTP zahtev upućen Responses API-ju pokreće prvu "rundu" u Codex razgovoru. Server će strimovati odgovor putem Server-Sent Events (SSE).

后续提示词结构

Imajte na umu da je upit iz prethodne runde tačan prefiks novog upita. Ovaj dizajn može značajno poboljšati efikasnost naknadnih zahteva - može se iskoristiti mehanizam keširanja upita.

多轮对话提示词增长

Uticaj stalnog produžavanja upita sa povećanjem rundi

1. U pogledu performansi

  • Povećanje troškova uzorkovanja modela: Stalno produžavanje upita će povećati troškove uzorkovanja modela, jer proces uzorkovanja zahteva obradu više podataka, što dovodi do povećanja količine izračunavanja.
  • Smanjenje efikasnosti keširanja: Sa stalnim produžavanjem upita sa povećanjem rundi, povećava se poteškoća preciznog podudaranja prefiksa, a smanjuje se mogućnost pogađanja keša.

2. U pogledu upravljanja kontekstnim prozorom

  • Kontekstni prozor se lako iscrpljuje: Stalno produžavanje upita će dovesti do brzog povećanja broja tokena u razgovoru, a kada se prekorači prag kontekstnog prozora, može doći do iscrpljivanja kontekstnog prozora.
  • Povećanje potrebe za operacijama kompresije: Da bi se izbeglo iscrpljivanje kontekstnog prozora, potrebno je komprimovati razgovor kada broj tokena pređe prag.

3. U pogledu rizika od promašaja keša

  • Različite operacije lako izazivaju promašaj keša: Ako produžavanje upita uključuje promene dostupnih alata modela, ciljnog modela, konfiguracije sandbox-a i drugih operacija, to će dodatno povećati rizik od promašaja keša.
  • MCP alati povećavaju složenost: MCP server može dinamički da promeni listu ponuđenih alata, a odgovor na relevantna obaveštenja u dugotrajnim razgovorima može dovesti do promašaja keša.

Referentne informacije: 《Unrolling the Codex agent loop》Izvor: OpenAI

Published in Technology

You Might Also Like