Gusto Mong Maunawaan ang Codex Agent? Huwag Palampasin ang Malalimang Pagsusuring Ito!

2/14/2026
5 min read

Gusto Mong Maunawaan ang Codex Agent? Huwag Palampasin ang Malalimang Pagsusuring Ito!

May ginawang "kakaiba" ang OpenAI.

Kadalasan, naglalabas ang OpenAI ng mas malalakas na modelo (tulad ng o1), ngunit sa pagkakataong ito, naglabas sila ng isang malalimang teknikal na blog na pinamagatang 《Unrolling the Codex agent loop》, hindi lamang nila binuksan ang core logic ng Codex CLI, kundi ipinaliwanag din nila nang detalyado kung paano gumagana ang isang mature na code agent (Coding Agent).

Codex CLI

Sa kasalukuyang panahon na patok na patok ang Claude Code at Cursor, ang artikulong ito ng OpenAI ay hindi lamang pagpapakita ng kanilang galing, kundi isa ring "gabay para maiwasan ang mga pagkakamali para sa mga arkitekto ng Agent". Kung gusto mong gamitin nang mahusay ang mga AI programming tool, o gusto mong gumawa ng sarili mong Agent, sulit na basahin ang artikulong ito nang buo.

Mahigit 8300+ salita ang buong teksto, at aabutin ng mga 20min para basahin.

Una, Ano ang Codex CLI?

Ang Codex CLI ay isang open-source na coding Agent tool na gawa ng OpenAI, na maaaring patakbuhin sa lokal na computer, o i-install sa code editor. Suportado ang VS Code, Cursor, Windsurf, at iba pa.

Open-source address: https://github.com/openai/codex

Codex CLI界面

At ang Agent Loop (siklo ng ahente) na ipapakilala ngayon ay ang core logic ng Codex CLI: responsable sa pag-coordinate sa user, modelo, at pagtawag ng modelo, upang maisagawa ang mga interaksyon sa pagitan ng mga tool na may halaga.

Agent Loop (Siklo ng Intelihenteng Ahente)

Ang modelo ay isa lamang component, ang Agent (intelihenteng ahente) ang bumubuo sa produkto.

Ang core ng bawat AI Agent ay ang tinatawag na "siklo ng intelihenteng ahente (Agent Loop)". Ang diagram ng siklo ng intelihenteng ahente ay ipinapakita sa ibaba:

Agent Loop示意图

Karaniwan nating iniisip na ang AI programming ay: "Nagtanong ako, sumagot ito". Ngunit sa loob ng Codex CLI, ito ay isang kumplikadong walang katapusang proseso...

Ang isang karaniwang Agent Loop ay naglalaman ng mga sumusunod na hakbang:

  • Direktiba ng User: Isang set ng mga text na direktiba na ipinasok ng user (halimbawa, "i-refactor ang function na ito").
  • Paghihinuha ng Modelo: Nagpapasya ang modelo kung direktang sasagot, o tatawag ng tool (Tool Call).
  • Pagtatawag ng Tool: Kung magpasya ang modelo na tumawag ng list files o run shell, isasagawa ng CLI ang mga command na ito sa lokal.
  • Obserbasyon (Observation): Kinukuha ang resulta ng pagpapatupad ng tool (code, error, listahan ng file).
  • Siklo: Ang mga resultang ito ay idinaragdag sa kasaysayan ng pag-uusap, at muling ipinapakain sa modelo. Pagkatapos makita ng modelo ang resulta, nagpapasya ito sa susunod na hakbang.
  • Pagtatapos: Hanggang sa isipin ng modelo na tapos na ang gawain, ilalabas nito ang huling sagot.

Ang buong proseso mula sa "input ng user" hanggang sa "tugon ng intelihenteng ahente" ay tinatawag na isang round ng pag-uusap (tinatawag na isang thread sa Codex).

Multi-turn Agent loop

Habang nagpapatuloy ang pag-uusap, tumataas din ang haba ng prompt na ginagamit para sa paghihinuha ng modelo. Mahalaga ang haba na ito, dahil ang bawat modelo ay may context window, na kumakatawan sa maximum na bilang ng mga token na maaaring gamitin ng modelo sa isang pagtawag ng paghihinuha.

Paghihinuha ng Modelo

Nagpapadala ang Codex CLI ng HTTP request sa Responses API para sa paghihinuha ng modelo. Ginagamit ng Codex ang Responses API para patakbuhin ang siklo ng ahente.

Ano ang Responses API?

Ang Responses API ay isang bagong henerasyong interface ng pagbuo ng intelihenteng ahente na inilunsad ng OpenAI noong Marso 2025, na naglalayong pag-isahin ang kakayahan sa pag-uusap, pagtawag ng tool, at pagproseso ng multi-modal, upang magbigay sa mga developer ng mas flexible at mas makapangyarihang karanasan sa pagbuo ng AI application.

Ang Responses API endpoint na ginagamit ng Codex CLI ay maaaring i-configure, at maaaring gamitin sa anumang endpoint na nagpapatupad ng Responses API.

Prompt构建流程

Pag-sample ng Modelo (Pagbuo ng Tugon)

Ang HTTP request na inilunsad sa Responses API ay magsisimula sa unang "round" sa pag-uusap ng Codex. Ibabalik ng server ang tugon sa pamamagitan ng Server-Sent Events (SSE) streaming.

后续提示词结构

Tandaan, ang prompt mula sa nakaraang round ay ang eksaktong prefix ng bagong prompt. Ang ganitong disenyo ay maaaring makabuluhang mapabuti ang kahusayan ng mga kasunod na request - maaaring gamitin ang mekanismo ng prompt caching.

多轮对话提示词增长

Epekto ng Patuloy na Paghaba ng Prompt Habang Tumatagal ang mga Round

1. Sa Aspektong Pagganap

  • Pagtaas ng Gastos sa Pag-sample ng Modelo: Ang patuloy na paghaba ng prompt ay magpapataas sa gastos sa pag-sample ng modelo, dahil kailangang magproseso ng mas maraming data ang proseso ng pag-sample, na magreresulta sa pagtaas ng dami ng pagkalkula.
  • Pagbaba ng Benepisyo ng Cache: Habang patuloy na humahaba ang prompt habang tumatagal ang mga round, tumataas ang kahirapan sa eksaktong pagtutugma ng prefix, at bumababa ang posibilidad ng cache hit.

2. Sa Aspektong Pamamahala ng Context Window

  • Madaling Maubos ang Context Window: Ang patuloy na paghaba ng prompt ay magpapabilis sa pagtaas ng bilang ng mga token sa pag-uusap, at kapag lumampas ito sa threshold ng context window, maaaring magresulta ito sa pagkaubos ng context window.
  • Pagtaas ng Pangangailangan sa Operasyon ng Compression: Upang maiwasan ang pagkaubos ng context window, kailangang i-compress ang pag-uusap kapag lumampas ang bilang ng mga token sa threshold.

3. Sa Aspektong Panganib ng Hindi Pagkakatama ng Cache

  • Madaling Magdulot ng Hindi Pagkakatama ng Cache ang Maraming Operasyon: Kung ang paghaba ng prompt ay nagsasangkot ng pagbabago sa mga tool na magagamit ng modelo, target na modelo, configuration ng sandbox, atbp., lalo nitong tataasan ang panganib ng hindi pagkakatama ng cache.
  • Pinapataas ng MCP Tool ang Pagiging Kumplikado: Maaaring dynamic na baguhin ng MCP server ang listahan ng mga tool na ibinibigay, at ang pagtugon sa mga nauugnay na notification sa mahabang pag-uusap ay maaaring magdulot ng hindi pagkakatama ng cache.

Sanggunian: 《Unrolling the Codex agent loop》Pinagmulan: OpenAI

Published in Technology

You Might Also Like