Параметр тохируулахгүйгээр код бич! Jeff Clune багийн шинэ бүтээл: Meta Agent санах ойн модулийг автоматаар хөгжүүлнэ
Параметр тохируулахгүйгээр код бич! Jeff Clune багийн шинэ бүтээл: Meta Agent санах ойн модулийг автоматаар хөгжүүлнэ
Software 3.0 руу хүрэх замд AI өөрөө Python код бичиж тархиа хөгжүүлж эхэллээ.

Agent хөгжүүлэлтийн гүн рүү ороход санах ой (Memory) бол зайлсхийх аргагүй асуудал хэвээр байна.
Суурь загваруудын чадавхи улам бүр хүчтэй болж байгаа хэдий ч, үндсэндээ дүгнэлт хийх явцад төлөвгүй (Stateless) байдаг нь Agent-ийн туршлага хуримтлуулах чадварыг хязгаарладаг.
Одоогийн байдлаар санах ойг боловсруулах салбарын гол шийдэл болох RAG эсвэл гулсах цонхны хураангуй нь үндсэндээ хүний гараар бүтээсэн хеуристик дүрмийн үе шатанд хэвээр байна.
Гараар хийсэн санах ойн модуль нь маш эмзэг бөгөөд шилжүүлэхэд хэцүү бөгөөд ярианы системд зориулж нарийн тохируулсан Prompt болон хайлтын логик нь урт хугацааны төлөвлөлтийн даалгаварт (жишээлбэл, ALFWorld) эсвэл нарийн төвөгтэй стратегийн тоглоомуудад шууд хүчингүй болдог.

Энэхүү хүндрэлийг шийдвэрлэхийн тулд UBC-ийн профессор, OpenAI-ийн хуучин судлаач Jeff Clune баг гикийн шийдлийг санал болгосон.
Ямар санах ойн бүтэц хамгийн сайн болохыг мэдэхгүй байгаа бол Agent өөрөө Python код бичиж зохион бүтээг.
Энэ бол дөнгөж саяхан гаргасан ALMA (Automated meta-Learning of Memory designs for Agentic systems) юм.
ADAS-аас ALMA хүртэл: Кодонд суурилсан автоматжуулсан дизайн
ALMA бол тус багийн сүүлийн үед дэмжиж буй AI үүсгэх алгоритмын технологийн маршрутын үргэлжлэл юм.

ADAS (Automated Design of Agentic Systems)-д баг Agent-ийн архитектурыг зохион бүтээхдээ код нь мэдрэлийн сүлжээний жин эсвэл Soft Prompts-ээс илүү үр дүнтэй хайлтын орон зай болохыг баталсан. Код нь Тюрингийн бүрэн бүтэн байдалтай бөгөөд маш сайн тайлбарлах чадвартай.

Дараа нь DGM (Darwin Gödel Machine)-д баг хувьслын алгоритм дахь нээлттэй хайлтын ойлголтыг нэвтрүүлж, дизайны архивыг хадгалж, загварыг шинэлэг шийдлийг судлахад урамшуулдаг.

ALMA нь ADAS-ийн код үүсгэх парадигм болон DGM-ийн хувьслын стратегийг өвлөн авч, хэрэглээний хувилбарыг Agent системийн хамгийн ихээр хүний туршлагаас хамааралтай бүрэлдэхүүн хэсэг болох санах ойд төвлөрүүлдэг.
ALMA-ийн ажлын механизм
ALMA-ийн ажиллах механизм нь мета сургалтын стандарт хаалттай гогцоо юм. Meta Agent даалгаврыг шууд боловсруулахгүй, харин код бичих үүрэгтэй. Процесс нь дөрвөн үе шаттай:
- Санаа бодох: Одоогийн санах ойн дизайны архивыг шинжилж, түүхэн үзүүлэлтэд үндэслэн сайжруулах шийдлийг боловсруулах
- Төлөвлөх: Санааг хуурамч кодын логик болгон хувиргах
- Хэрэгжүүлэх: Гол функцийг тодорхойлж, гүйцэтгэх боломжтой Python код бичих
- Үнэлэх: Үүсгэсэн кодыг элсэн хайрцагт байрлуулж даалгаврыг гүйцэтгэж, гүйцэтгэлийн үзүүлэлтийг буцаах

Хувьслын явцад ALMA асар том дизайны модыг үүсгэдэг. Итерацийн алхамууд нэмэгдэхийн хэрээр үүсгэсэн санах ойн код нь энгийн хадгалах логикоос нарийн төвөгтэй танин мэдэхүйн архитектур болж аажмаар хөгждөг.

Хөгжсөн санах ойн бүтэц
ALMA-аас үүсгэсэн санах ойн дизайн нь янз бүрийн даалгаварт маш их ялгаатай байдлыг харуулсан:
- MiniHack (шорон судлах): Цус алдахад хүргэсэн үйлдэл болон мангасын түрэмгийллийг тодорхой бүртгэдэг Risk and Interaction модулийг зохион бүтээсэн
- Baba Is AI (логик таавар): Даалгаврыг гүйцэтгэхэд шаардлагатай дүрмийн хослолыг бүртгэдэг Strategy Library-г зохион бүтээсэн

Энэ нь AI даалгаврын онцлогийг таних чадвартайг харуулж байна: амьд үлдэх тоглоом нь эрсдэлд анхаарлаа хандуулах хэрэгтэй, тааврын тоглоом нь дүрмийн хийсвэрлэлд анхаарлаа хандуулах хэрэгтэй.
Туршилтын үр дүн
ALMA-г TextWorld, ALFWorld, MiniHack, Baba Is AI гэсэн дөрвөн орчинд гол суурь шугамтай харьцуулсан.
GPT-5-mini загвар дээр ALMA-ийн амжилтын дундаж хувь 53.9% -д хүрч, G-Memory (46.0%) болон Trajectory Retrieval (48.6%)-ээс давсан.

Зардлын үр ашгийн хувьд ALMA дунджаар ердөө 1,319 tokens зарцуулсан бол Trajectory Retrieval 9,149 tokens, G-Memory 6,055 tokens зарцуулсан. ALMA нь ердөө 1/7-оос 1/5-ийн зардлаар илүү сайн гүйцэтгэлийг олж авсан.

Дүгнэлт
ALMA нь Software 2.0 (Neural Networks)-оос Software 3.0 (AI-Generating Algorithms) руу шилжих боломжийг харуулж байна.
Agent хөгжүүлэлтэд санах ойн модулийн дизайн нь инженерүүдийн зөн совингоос удаан хугацаанд хамааралтай байсан. ALMA нь мета сургалт болон код үүсгэх замаар AI нь тодорхой орчинд хамгийн оновчтой санах ойн архитектурыг автоматаар олж чадна гэдгийг баталсан.
Нөөцийн холбоос
- Өгүүлэл: https://arxiv.org/pdf/2602.07755
- Код: https://github.com/zksha/alma
- Төслийн үндсэн хуудас: https://yimingxiong.me/alma





