Параметрлерді реттемей, тек код жазамыз! Джефф Клун командасының жаңа жұмысы: Meta Agent жад модулін автоматты түрде дамытады

2/14/2026
3 min read

Параметрлерді реттемей, тек код жазамыз! Джефф Клун командасының жаңа жұмысы: Meta Agent жад модулін автоматты түрде дамытады

Software 3.0-ге жол, AI миды дамыту үшін Python кодын өзі жаза бастады.

ALMA

Agent әзірлеудің терең суларында жад (Memory) әрқашан айналып өтуге болмайтын ауыр нүкте болып қала береді.

Негізгі модельдің мүмкіндіктері күннен-күнге күшейіп келе жатқанымен, ол пайымдау процесінде мәні бойынша күйсіз (Stateless), бұл Agent-тің тәжірибе жинақтау мүмкіндігін шектейді.

Қазіргі уақытта жадты өңдеудің негізгі шешімдері RAG немесе жылжымалы терезе конспектісі болсын, мәні бойынша қолмен жасалған эвристикалық ережелер кезеңінде қалып отыр.

Қолмен жасалған жад модулі өте осал және көшіруге қиын, диалог жүйесі үшін мұқият реттелген Prompt және іздеу логикасы ұзақ мерзімді жоспарлау тапсырмаларына (мысалы, ALFWorld) немесе күрделі стратегиялық ойындарға қойылса, көбінесе тікелей істен шығады.

ALMA архитектурасы

Осы қиындыққа байланысты UBC профессоры, OpenAI бұрынғы зерттеушісі Джефф Клун командасы гик стиліндегі шешім ұсынды.

Қандай жад құрылымының ең жақсы екенін білмегендіктен, Agent-тің өзіне Python кодын жазу арқылы жобалауға мүмкіндік берейік.

Бұл жаңадан шыққан ALMA (Automated meta-Learning of Memory designs for Agentic systems).

ADAS-тан ALMA-ға дейін: Кодқа негізделген автоматтандырылған дизайн

ALMA - бұл команданың жақында қолдаған AI генерациялау алгоритмдерінің техникалық бағытының жалғасы.

ADAS

ADAS (Automated Design of Agentic Systems) ішінде команда Agent архитектурасын жобалау кезінде кодтың нейрондық желі салмағынан немесе Soft Prompts-тен гөрі тиімдірек іздеу кеңістігі екенін дәлелдеді. Код Тьюрингтің толықтығына ие және өте түсінікті.

Meta Agent

Кейіннен DGM (Darwin Gödel Machine) ішінде команда эволюциялық алгоритмдегі ашық зерттеу тұжырымдамасын енгізді, жаңа шешімдерді зерттеуге ынталандыратын дизайн мұрағатын жүргізді.

DGM

ALMA ADAS-тың код генерациялау парадигмасын және DGM-нің эволюциялық стратегиясын мұра етті, қолдану сценарийін Agent жүйесіндегі адам тәжірибесіне ең тәуелді компонентке - жадқа бағыттады.

ALMA жұмыс істеу механизмі

ALMA жұмыс істеу механизмі - бұл стандартты мета-оқыту тұйық циклі. Meta Agent енді тікелей тапсырмаларды өңдемейді, керісінше бағдарламалауға жауапты. Процесс төрт кезеңнен тұрады:

  • Ойластыру: Ағымдағы жад дизайны мұрағатын талдау, тарихи көрсеткіштерге негізделген жетілдіру жоспарларын ойластыру
  • Жоспарлау: Ойластыруды жалған код логикасына айналдыру
  • Іске асыру: Орындалатын Python кодын жазу, негізгі функцияларды анықтау
  • Бағалау: Жасалған кодты құмсалғыш ортасына орналастыру, өнімділік көрсеткіштерін кері байланыс

Жұмыс процесі

Эволюция процесінде ALMA үлкен дизайн ағашын жасайды. Итерация қадамдарының артуымен жасалған жад коды қарапайым сақтау логикасынан күрделі танымдық архитектураға бірте-бірте эволюцияланады.

Эволюция ағашы

Эволюцияланған жад құрылымы

ALMA жасаған жад дизайны әртүрлі тапсырмаларда үлкен айырмашылықтарды көрсетті:

  • MiniHack (жер асты зынданын зерттеу): Қан кетуге әкелетін әрекеттер мен құбыжықтардың агрессиясын нақты жазатын Risk and Interaction модулін жобалады
  • Baba Is AI (логикалық бас қатырғыш): Деңгейлерден өту үшін қажетті ережелер комбинациясын жазатын Strategy Library жобалады

Жад құрылымы

Бұл AI-дің тапсырма ерекшеліктерін анықтай алатынын көрсетеді: тіршілік ету ойындары қауіпке назар аударуды қажет етеді, бас қатырғыш ойындар ережелерді абстракциялауға назар аударуды қажет етеді.

Эксперимент нәтижелері

TextWorld, ALFWorld, MiniHack, Baba Is AI төрт ортасында ALMA-ны негізгі базалық сызықтармен салыстырды.

GPT-5-mini моделінде ALMA-ның орташа табыс деңгейі 53.9%-ке жетті, бұл G-Memory (46.0%) және Trajectory Retrieval (48.6%) көрсеткіштерінен жақсырақ.

Эксперимент нәтижелері

Шығын тиімділігі тұрғысынан ALMA орташа есеппен 1,319 токенді ғана тұтынады, ал Trajectory Retrieval 9,149 токенді, G-Memory 6,055 токенді тұтынады. ALMA шамамен 1/7-ден 1/5-ке дейінгі шығынмен жақсырақ өнімділікке қол жеткізді.

Шығын тиімділігі

Қорытынды

ALMA Software 2.0 (Neural Networks) бағдарламасынан Software 3.0 (AI-Generating Algorithms) бағдарламасына өту мүмкіндігін көрсетеді.

Agent әзірлеуде жад модулінің дизайны ұзақ уақыт бойы инженерлердің интуициясына тәуелді болды. ALMA мета-оқыту және код генерациялау арқылы AI нақты ортаға сәйкес оңтайлы жад архитектурасын автоматты түрде таба алатынын дәлелдеді.

Ресурстар сілтемелері

Published in Technology

You Might Also Like

Бұлтты есептеу технологиясын қалай пайдалану керек: Сіздің алғашқы бұлттық инфрақұрылымыңызды құруға арналған толық нұсқаулықTechnology

Бұлтты есептеу технологиясын қалай пайдалану керек: Сіздің алғашқы бұлттық инфрақұрылымыңызды құруға арналған толық нұсқаулық

Бұлтты есептеу технологиясын қалай пайдалану керек: Сіздің алғашқы бұлттық инфрақұрылымыңызды құруға арналған толық нұсқ...

Ескерту! Claude Code-тың әкесі ашық айтты: 1 айдан кейін Plan Mode қолданылмайды, бағдарламалық инженер атағы жоғаладыTechnology

Ескерту! Claude Code-тың әкесі ашық айтты: 1 айдан кейін Plan Mode қолданылмайды, бағдарламалық инженер атағы жоғалады

Ескерту! Claude Code-тың әкесі ашық айтты: 1 айдан кейін Plan Mode қолданылмайды, бағдарламалық инженер атағы жоғалады ...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026 жылғы Топ 10 AI агенттері: Негізгі артықшылықтарды талдауTechnology

2026 жылғы Топ 10 AI агенттері: Негізгі артықшылықтарды талдау

2026 жылғы Топ 10 AI агенттері: Негізгі артықшылықтарды талдау Кіріспе Жасанды интеллекттің жылдам дамуы арқасында AI аг...

2026 жыл: Топ 10 AI құралдары ұсынысы: Жасанды интеллектінің шынайы әлеуетін ашуTechnology

2026 жыл: Топ 10 AI құралдары ұсынысы: Жасанды интеллектінің шынайы әлеуетін ашу

2026 жыл: Топ 10 AI құралдары ұсынысы: Жасанды интеллектінің шынайы әлеуетін ашу Технологияның жылдам дамып жатқан бүгін...

2026 жылғы AWS құралдары мен ресурстарының 10 үздігіTechnology

2026 жылғы AWS құралдары мен ресурстарының 10 үздігі

2026 жылғы AWS құралдары мен ресурстарының 10 үздігі Жылдам дамып келе жатқан бұлтты есептеу саласында Amazon Web Servic...