Viltu skilja Codex umboðsmanninn? Þessa ítarlegu greiningu má ekki missa af!

2/14/2026
4 min read

Viltu skilja Codex umboðsmanninn? Þessa ítarlegu greiningu má ekki missa af!

OpenAI gerði nýlega eitthvað „óvenjulegt“.

Venjulega gefur OpenAI út öflugri módel (eins og o1), en að þessu sinni gáfu þeir út ítarlega tæknilega bloggfærslu, „Unrolling the Codex agent loop“, þar sem þeir opnuðu ekki aðeins kjarna rökfræði Codex CLI, heldur sundurgreindu einnig hvernig þroskaður kóðaumboðsmaður (Coding Agent) virkar.

Codex CLI

Á þeim tíma þegar Claude Code og Cursor eru að ná miklum vinsældum er þessi grein frá OpenAI ekki aðeins til að sýna vöðvana, heldur einnig „leiðbeiningar fyrir arkitekta umboðsmanna til að forðast gildrur“. Hvort sem þú vilt nota AI forritunarverkfæri vel eða þróa þinn eigin umboðsmann, þá er þessi grein þess virði að lesa vandlega.

Greinin er 8300+ orð og tekur um það bil 20 mínútur að lesa.

Í fyrsta lagi, hvað er Codex CLI?

Codex CLI er opinn kóða umboðsmaður frá OpenAI sem hægt er að keyra á staðbundinni tölvu eða setja upp í kóðaritli. Styður VS Code, Cursor, Windsurf o.fl.

Opinn kóði: https://github.com/openai/codex

Codex CLI界面

Agent Loop (umboðsmannalykkjan) sem fjallað verður um í þetta skiptið er kjarna rökfræði Codex CLI: hún ber ábyrgð á að samræma notendur, módel og módelköll til að framkvæma samskipti milli verðmætra verkfæra.

Agent Loop (umboðsmannalykkja)

Módel eru bara íhlutir, en umboðsmenn (Agents) geta myndað vöru.

Kjarninn í hverjum AI Agent er svokölluð „umboðsmannalykkja (Agent Loop)“. Skýringarmynd af umboðsmannalykkjunni er sýnd hér að neðan:

Agent Loop示意图

Við teljum venjulega að AI forritun sé: „Ég spyr, það svarar“. En innan Codex CLI er þetta flókið óendanlegt lykkjuferli...

Venjuleg Agent Loop inniheldur eftirfarandi þætti:

  • Notendaleiðbeiningar: Safn textaleiðbeininga sem notandi slær inn (til dæmis „endurgerðu þetta fall“).
  • Módelrök: Módel ákveður hvort það eigi að svara beint eða kalla á verkfæri (Tool Call).
  • Verkfærakall: Ef módel ákveður að kalla á list files eða run shell, mun CLI framkvæma þessar skipanir á staðnum.
  • Athugun (Observation): Niðurstöður verkfæraframkvæmdar (kóði, villur, skrárlistar) eru teknar.
  • Lykkja: Þessum niðurstöðum er bætt við samtalsferilinn og gefið aftur inn í módel. Eftir að módel hefur séð niðurstöðurnar ákveður það næsta skref.
  • Lokun: Þar til módel telur verkefninu lokið og gefur út endanlegt svar.

Allt ferlið frá „notandainnslætti“ til „umboðsmannasvörunar“ er kallað umferð samtals (kallað þráður í Codex).

Multi-turn Agent loop

Eftir því sem samtalinu vindur fram mun lengd vísbendingarinnar (Prompt) sem notuð er til að rökstyðja módel einnig aukast. Þessi lengd er mikilvæg vegna þess að hvert módel hefur samhengisglugga sem táknar hámarksfjölda tákna (tokens) sem módel getur notað í einu rökstyðjukalli.

Módelrök

Codex CLI sendir HTTP beiðni til Responses API til að rökstyðja módel. Codex notar Responses API til að knýja umboðsmannalykkjuna.

Hvað er Responses API?

Responses API er ný kynslóð af umboðsmannaþróunarviðmóti sem OpenAI gaf út í mars 2025, sem miðar að því að sameina samtal, verkfærakall og fjölbreytilega vinnslugetu til að veita þróunaraðilum sveigjanlegri og öflugri AI forritabyggingarupplifun.

Responses API endapunkturinn sem Codex CLI notar er stillanlegur og hægt að nota hann með hvaða endapunkti sem útfærir Responses API.

Prompt构建流程

Módel tekur sýni (býr til svar)

HTTP beiðnin sem send er til Responses API mun hefja fyrstu „umferðina“ í Codex samtalinu. Þjónninn mun streyma svörum til baka í gegnum Server-Sent Events (SSE).

后续提示词结构

Athugið að vísbendingin frá fyrri umferð er nákvæm forskeyti nýju vísbendingarinnar. Þessi hönnun getur bætt skilvirkni síðari beiðna verulega - hægt er að nýta skyndiminni vísbendinga.

多轮对话提示词增长

Áhrif þess að vísbendingar lengjast stöðugt með auknum umferðum

1. Hvað varðar afköst

  • Aukinn kostnaður við módelúrtöku: Stöðug lenging vísbendinga mun auka kostnað við módelúrtöku, vegna þess að úrtökuferlið þarf að vinna úr meiri gögnum, sem leiðir til aukins útreikningsmagns.
  • Minni skyndiminniávinningur: Eftir því sem vísbendingar lengjast stöðugt með auknum umferðum eykst erfiðleikinn við að passa nákvæm forskeyti og líkurnar á skyndiminnihöggi minnka.

2. Hvað varðar stjórnun samhengisglugga

  • Samhengisgluggi tæmist auðveldlega: Stöðug lenging vísbendinga mun valda því að fjöldi merkja í samtalinu eykst hratt og þegar farið er yfir þröskuld samhengisgluggans getur það leitt til þess að samhengisglugginn tæmist.
  • Aukin þörf fyrir þjöppunaraðgerðir: Til að forðast að samhengisglugginn tæmist þarf að þjappa samtalinu saman þegar fjöldi merkja fer yfir þröskuldinn.

3. Hvað varðar áhættuna af því að skyndiminni finnist ekki

  • Margar aðgerðir geta auðveldlega valdið því að skyndiminni finnist ekki: Ef breytingar á tiltækum verkfærum módel, markmódeli, sandkassastillingum o.s.frv. eru gerðar vegna lengingar vísbendinga, mun það auka áhættuna á því að skyndiminni finnist ekki enn frekar.
  • MCP verkfæri auka flækjustig: MCP þjónar geta breytt listanum yfir verkfæri sem eru í boði á kraftvirkan hátt og að bregðast við viðeigandi tilkynningum í löngum samtölum getur valdið því að skyndiminni finnist ekki.

Tilvísunarupplýsingar: „Unrolling the Codex agent loop“ Heimild: OpenAI

Published in Technology

You Might Also Like