Codex интеллектуалды агентін түсінгіңіз келе ме? Бұл терең талдауды жіберіп алмаңыз!
Codex интеллектуалды агентін түсінгіңіз келе ме? Бұл терең талдауды жіберіп алмаңыз!
OpenAI жаңа ғана «әдеттен тыс» әрекет жасады.
Әдетте, OpenAI күштірек модельдерді (мысалы, o1) шығарады, бірақ бұл жолы олар «Codex агентінің циклін ашу» атты терең техникалық блог жариялады, ол Codex CLI-нің негізгі логикасын ашық түрде жариялап қана қоймай, сонымен қатар жетілген кодтық интеллектуалды агенттің (Coding Agent) қалай жұмыс істейтінін қадам бойынша талдады.

Claude Code және Cursor жанкүйерлерді жаппай тартатын қазіргі уақытта OpenAI-дің бұл мақаласы бұлшық етті көрсету ғана емес, сонымен қатар «Агент сәулетшісінің қателіктерден аулақ болу жөніндегі нұсқаулығы» болып табылады. Сіз AI бағдарламалау құралдарын жақсы пайдаланғыңыз келсе де, немесе өзіңіз агент жасағыңыз келсе де, бұл мақаланы әр сөзін оқып шығуға тұрарлық.
Толық мәтін 8300+ сөзден тұрады, оқуға шамамен 20 минут кетеді.
Біріншіден, Codex CLI дегеніміз не?
Codex CLI - бұл OpenAI шығарған ашық бастапқы кодтық Agent құралы, оны жергілікті компьютерде іске қосуға немесе код редакторына орнатуға болады. VS Code, Cursor, Windsurf және т.б. қолдайды.
Ашық бастапқы код мекенжайы: https://github.com/openai/codex

Ал бұл жолы таныстырылатын Agent Loop (агенттік цикл) - Codex CLI-нің негізгі логикасы: пайдаланушыны, модельді және модельді шақыруды үйлестіруге жауапты, құнды құралдар арасындағы өзара әрекеттесуді орындау үшін.
Agent Loop (интеллектуалды агенттік цикл)
Модельдер тек компоненттер ғана, Agent (интеллектуалды агент) өнімді құрай алады.
Әрбір AI Agent-тің негізі - «интеллектуалды агенттік цикл (Agent Loop)» деп аталады. Интеллектуалды агенттік циклдің схемасы төменде көрсетілген:

Біз әдетте AI бағдарламалауын: «Мен сұраймын, ол жауап береді» деп ойлаймыз. Бірақ Codex CLI ішінде бұл күрделі шексіз циклдік процесс...
Стандартты Agent Loop келесі қадамдарды қамтиды:
- Пайдаланушы нұсқаулары: Пайдаланушы енгізген мәтіндік нұсқаулар жиынтығы (мысалы, «осы функцияны қайта құрыңыз»).
- Модельдік тұжырым: Модель тікелей жауап беруді немесе құралды шақыруды (Tool Call) шешеді.
- Құралды шақыру: Егер модель файлдарды тізімдеуді немесе қабықты іске қосуды шешсе, CLI бұл командаларды жергілікті жерде орындайды.
- Бақылау (Observation): Құралды орындау нәтижелері (код, қателер, файлдар тізімі) түсіріледі.
- Цикл: Бұл нәтижелер диалог тарихына қосылып, қайтадан модельге беріледі. Модель нәтижені көргеннен кейін, келесі қадамды шешеді.
- Аяқтау: Модель тапсырманың аяқталғанын сезгенше, соңғы жауапты шығарады.
«Пайдаланушы енгізуінен» «интеллектуалды агенттің жауабына» дейінгі бүкіл процесс диалогтың бір айналымы деп аталады (Codex-те ағын деп аталады).

Диалог барысында модельді тұжырымдау үшін пайдаланылатын шақыру сөзінің (Prompt) ұзындығы да артады. Бұл ұзындық маңызды, өйткені әрбір модельдің контекстік терезесі бар, ол модельдің бір тұжырымдау шақыруында пайдалана алатын максималды таңбалар санын (tokens) білдіреді.
Модельдік тұжырым
Codex CLI модельдік тұжырымдау үшін Responses API-ге HTTP сұрауын жібереді. Codex агенттік циклді басқару үшін Responses API-ді пайдаланады.
Responses API дегеніміз не?
Responses API - OpenAI 2025 жылдың наурыз айында шығарған жаңа буынды интеллектуалды агентті әзірлеу интерфейсі, ол диалогты, құралды шақыруды және көп модальды өңдеу мүмкіндіктерін біріктіруге, әзірлеушілерге икемдірек және қуаттырақ AI қосымшаларын құру тәжірибесін ұсынуға бағытталған.
Codex CLI пайдаланатын Responses API соңғы нүктесін конфигурациялауға болады және Responses API-ді жүзеге асыратын кез келген соңғы нүктемен бірге пайдалануға болады.

Модельдік үлгілеу (жауап жасау)
Responses API-ге жіберілген HTTP сұрауы Codex диалогындағы алғашқы «айналымды» іске қосады. Сервер Server-Sent Events (SSE) арқылы жауапты ағынды түрде қайтарады.

Ескеріңіз, алдыңғы айналымдағы шақыру сөзі жаңа шақыру сөзінің дәл префиксі болып табылады. Бұл дизайн кейінгі сұраулардың тиімділігін айтарлықтай арттыра алады - шақыру сөзінің кэш механизмін пайдалануға болады.

Шақыру сөзінің айналым санының артуының әсері
1. Өнімділік жағынан
- Модельдік үлгілеу құнының артуы: Шақыру сөзінің ұзаруы модельдік үлгілеу құнын арттырады, өйткені үлгілеу процесі көбірек деректерді өңдеуді қажет етеді, бұл есептеу көлемінің ұлғаюына әкеледі.
- Кэштеу тиімділігінің төмендеуі: Шақыру сөзінің айналым санының артуымен дәл префиксті сәйкестендіру қиындайды, кэштің табысты болу ықтималдығы төмендейді.
2. Контекстік терезені басқару жағынан
- Контекстік терезенің тез таусылуы: Шақыру сөзінің ұзаруы диалогтағы белгілер санының тез артуына әкеледі, контекстік терезенің шекті мәнінен асып кетсе, контекстік терезенің таусылуына әкелуі мүмкін.
- Қысу операциясының қажеттілігінің артуы: Контекстік терезенің таусылуын болдырмау үшін, белгілер саны шекті мәннен асқан кезде диалогты қысу қажет.
3. Кэштің өткізіп жіберу қаупі жағынан
- Көптеген операциялар кэштің өткізіп жіберілуін тудыруы мүмкін: Егер шақыру сөзінің ұзаруына байланысты модельдің қол жетімді құралдарын, мақсатты модельді, құмсалғыш конфигурациясын және т.б. өзгертуге қатысты операциялар болса, кэштің өткізіп жіберу қаупі одан әрі артады.
- MCP құралы күрделілікті арттырады: MCP сервері ұсынылатын құралдар тізімін динамикалық түрде өзгерте алады, ұзақ диалогтарда тиісті хабарламаларға жауап беру кэштің өткізіп жіберілуіне әкелуі мүмкін.
Ақпарат көзі: «Codex агентінің циклін ашу» Дереккөз: OpenAI





