Параметр тохируулахгүйгээр код бич! Jeff Clune багийн шинэ бүтээл: Meta Agent санах ойн модулийг автоматаар хөгжүүлнэ

2/14/2026
4 min read

Параметр тохируулахгүйгээр код бич! Jeff Clune багийн шинэ бүтээл: Meta Agent санах ойн модулийг автоматаар хөгжүүлнэ

Software 3.0 руу хүрэх замд AI өөрөө Python код бичиж тархиа хөгжүүлж эхэллээ.

ALMA

Agent хөгжүүлэлтийн гүн рүү ороход санах ой (Memory) бол зайлсхийх аргагүй асуудал хэвээр байна.

Суурь загваруудын чадавхи улам бүр хүчтэй болж байгаа хэдий ч, үндсэндээ дүгнэлт хийх явцад төлөвгүй (Stateless) байдаг нь Agent-ийн туршлага хуримтлуулах чадварыг хязгаарладаг.

Одоогийн байдлаар санах ойг боловсруулах салбарын гол шийдэл болох RAG эсвэл гулсах цонхны хураангуй нь үндсэндээ хүний гараар бүтээсэн хеуристик дүрмийн үе шатанд хэвээр байна.

Гараар хийсэн санах ойн модуль нь маш эмзэг бөгөөд шилжүүлэхэд хэцүү бөгөөд ярианы системд зориулж нарийн тохируулсан Prompt болон хайлтын логик нь урт хугацааны төлөвлөлтийн даалгаварт (жишээлбэл, ALFWorld) эсвэл нарийн төвөгтэй стратегийн тоглоомуудад шууд хүчингүй болдог.

ALMA архитектур

Энэхүү хүндрэлийг шийдвэрлэхийн тулд UBC-ийн профессор, OpenAI-ийн хуучин судлаач Jeff Clune баг гикийн шийдлийг санал болгосон.

Ямар санах ойн бүтэц хамгийн сайн болохыг мэдэхгүй байгаа бол Agent өөрөө Python код бичиж зохион бүтээг.

Энэ бол дөнгөж саяхан гаргасан ALMA (Automated meta-Learning of Memory designs for Agentic systems) юм.

ADAS-аас ALMA хүртэл: Кодонд суурилсан автоматжуулсан дизайн

ALMA бол тус багийн сүүлийн үед дэмжиж буй AI үүсгэх алгоритмын технологийн маршрутын үргэлжлэл юм.

ADAS

ADAS (Automated Design of Agentic Systems)-д баг Agent-ийн архитектурыг зохион бүтээхдээ код нь мэдрэлийн сүлжээний жин эсвэл Soft Prompts-ээс илүү үр дүнтэй хайлтын орон зай болохыг баталсан. Код нь Тюрингийн бүрэн бүтэн байдалтай бөгөөд маш сайн тайлбарлах чадвартай.

Meta Agent

Дараа нь DGM (Darwin Gödel Machine)-д баг хувьслын алгоритм дахь нээлттэй хайлтын ойлголтыг нэвтрүүлж, дизайны архивыг хадгалж, загварыг шинэлэг шийдлийг судлахад урамшуулдаг.

DGM

ALMA нь ADAS-ийн код үүсгэх парадигм болон DGM-ийн хувьслын стратегийг өвлөн авч, хэрэглээний хувилбарыг Agent системийн хамгийн ихээр хүний туршлагаас хамааралтай бүрэлдэхүүн хэсэг болох санах ойд төвлөрүүлдэг.

ALMA-ийн ажлын механизм

ALMA-ийн ажиллах механизм нь мета сургалтын стандарт хаалттай гогцоо юм. Meta Agent даалгаврыг шууд боловсруулахгүй, харин код бичих үүрэгтэй. Процесс нь дөрвөн үе шаттай:

  • Санаа бодох: Одоогийн санах ойн дизайны архивыг шинжилж, түүхэн үзүүлэлтэд үндэслэн сайжруулах шийдлийг боловсруулах
  • Төлөвлөх: Санааг хуурамч кодын логик болгон хувиргах
  • Хэрэгжүүлэх: Гол функцийг тодорхойлж, гүйцэтгэх боломжтой Python код бичих
  • Үнэлэх: Үүсгэсэн кодыг элсэн хайрцагт байрлуулж даалгаврыг гүйцэтгэж, гүйцэтгэлийн үзүүлэлтийг буцаах

Ажлын урсгал

Хувьслын явцад ALMA асар том дизайны модыг үүсгэдэг. Итерацийн алхамууд нэмэгдэхийн хэрээр үүсгэсэн санах ойн код нь энгийн хадгалах логикоос нарийн төвөгтэй танин мэдэхүйн архитектур болж аажмаар хөгждөг.

Хувьслын мод

Хөгжсөн санах ойн бүтэц

ALMA-аас үүсгэсэн санах ойн дизайн нь янз бүрийн даалгаварт маш их ялгаатай байдлыг харуулсан:

  • MiniHack (шорон судлах): Цус алдахад хүргэсэн үйлдэл болон мангасын түрэмгийллийг тодорхой бүртгэдэг Risk and Interaction модулийг зохион бүтээсэн
  • Baba Is AI (логик таавар): Даалгаврыг гүйцэтгэхэд шаардлагатай дүрмийн хослолыг бүртгэдэг Strategy Library-г зохион бүтээсэн

Санах ойн бүтэц

Энэ нь AI даалгаврын онцлогийг таних чадвартайг харуулж байна: амьд үлдэх тоглоом нь эрсдэлд анхаарлаа хандуулах хэрэгтэй, тааврын тоглоом нь дүрмийн хийсвэрлэлд анхаарлаа хандуулах хэрэгтэй.

Туршилтын үр дүн

ALMA-г TextWorld, ALFWorld, MiniHack, Baba Is AI гэсэн дөрвөн орчинд гол суурь шугамтай харьцуулсан.

GPT-5-mini загвар дээр ALMA-ийн амжилтын дундаж хувь 53.9% -д хүрч, G-Memory (46.0%) болон Trajectory Retrieval (48.6%)-ээс давсан.

Туршилтын үр дүн

Зардлын үр ашгийн хувьд ALMA дунджаар ердөө 1,319 tokens зарцуулсан бол Trajectory Retrieval 9,149 tokens, G-Memory 6,055 tokens зарцуулсан. ALMA нь ердөө 1/7-оос 1/5-ийн зардлаар илүү сайн гүйцэтгэлийг олж авсан.

Зардлын үр ашиг

Дүгнэлт

ALMA нь Software 2.0 (Neural Networks)-оос Software 3.0 (AI-Generating Algorithms) руу шилжих боломжийг харуулж байна.

Agent хөгжүүлэлтэд санах ойн модулийн дизайн нь инженерүүдийн зөн совингоос удаан хугацаанд хамааралтай байсан. ALMA нь мета сургалт болон код үүсгэх замаар AI нь тодорхой орчинд хамгийн оновчтой санах ойн архитектурыг автоматаар олж чадна гэдгийг баталсан.

Нөөцийн холбоос

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy засварын гарын авлага: Гялалзсан домогт амьтан хэрхэн авах вэ

Claude Code Buddy засварын гарын авлага: Гялалзсан домогт амьтан хэрхэн авах вэ 2026 оны 4-р сарын 1-нд, Anthropic Claud...

Obsidian Defuddle-г танилцууллаа, Obsidian Web Clipper-ийг шинэ түвшинд гаргалааTechnology

Obsidian Defuddle-г танилцууллаа, Obsidian Web Clipper-ийг шинэ түвшинд гаргалаа

Obsidian Defuddle-г танилцууллаа, Obsidian Web Clipper-ийг шинэ түвшинд гаргалаа Би Obsidian-ийн үндсэн санааг үргэлж и...

OpenAI гэнэт "Гурван нэг"-ийг зарлалаа: Браузер + Программчлал + ChatGPT нэгдэж, дотооддоо өнгөрсөн жил буруу замаар явсан гэдгээ хүлээн зөвшөөрчээTechnology

OpenAI гэнэт "Гурван нэг"-ийг зарлалаа: Браузер + Программчлал + ChatGPT нэгдэж, дотооддоо өнгөрсөн жил буруу замаар явсан гэдгээ хүлээн зөвшөөрчээ

OpenAI гэнэт зарлалаа "Гурван нэг"-ийг: Браузер + Программчлал + ChatGPT нэгдэж, дотооддоо өнгөрсөн жил буруу замаар явс...

2026, өөрийгөө "засаглах" гэж бүү шах! Энэ 8 жижиг зүйлийг сайн хий, эрүүл мэнд өөрөө ирнэHealth

2026, өөрийгөө "засаглах" гэж бүү шах! Энэ 8 жижиг зүйлийг сайн хий, эрүүл мэнд өөрөө ирнэ

2026, өөрийгөө "засаглах" гэж бүү шах! Энэ 8 жижиг зүйлийг сайн хий, эрүүл мэнд өөрөө ирнэ Шинэ жил эхэлж байна, өнгөрс...

Тэрээр жингээ хасахад хичээж байгаа ээжүүд, яагаад чадахгүй байна вэ?Health

Тэрээр жингээ хасахад хичээж байгаа ээжүүд, яагаад чадахгүй байна вэ?

Тэрээр жингээ хасахад хичээж байгаа ээжүүд, яагаад чадахгүй байна вэ? Гуравдугаар сар дунджаар өнгөрч, таны жингийн хас...

📝
Technology

AI Браузер 24 цагийн тогтвортой ажиллах гарын авлага

AI Браузер 24 цагийн тогтвортой ажиллах гарын авлага Энэхүү заавар нь тогтвортой, удаан хугацаанд ажиллах AI браузерын о...