প্যারামিটার টিউনিং ছাড়াই, শুধু কোড লিখুন! জেফ ক্লাউনের দলের নতুন কাজ: মেটা এজেন্ট স্বয়ংক্রিয়ভাবে মেমরি মডিউল তৈরি করে

Software 3.0-এর দিকে, AI নিজেই Python কোড লিখে মস্তিষ্ককে উন্নত করছে।

ALMA

এজেন্ট ডেভলপমেন্টের গভীরে, মেমরি (Memory) সবসময় একটি গুরুত্বপূর্ণ বিষয়।

বেসিক মডেলের ক্ষমতা দিন দিন বাড়লেও, যুক্তির ক্ষেত্রে এটি মূলত স্টেটলেস (Stateless), যা এজেন্টকে ক্রমাগত অভিজ্ঞতা অর্জনে বাধা দেয়।

বর্তমানে মেমরি নিয়ে কাজ করার জন্য RAG বা উইন্ডো সামারাইজেশনের মতো যে পদ্ধতিগুলো আছে, সেগুলো মূলত মানুষের তৈরি করা নিয়ম-নীতির ওপর ভিত্তি করে তৈরি।

এইভাবে হাতে তৈরি করা মেমরি মডিউলগুলো খুবই দুর্বল এবং স্থানান্তর করা কঠিন। ডায়ালগ সিস্টেমের জন্য তৈরি করা প্রম্পট এবং রিট্রিভাল লজিক, যখন লং-রেঞ্জ প্ল্যানিং টাস্কে (যেমন ALFWorld) বা জটিল স্ট্র্যাটেজি গেমসে ব্যবহার করা হয়, তখন প্রায়ই অকার্যকর হয়ে যায়।

ALMA আর্কিটেকচার

এই সমস্যা সমাধানের জন্য UBC-র অধ্যাপক এবং OpenAI-এর প্রাক্তন গবেষক জেফ ক্লাউনের দল একটি দারুণ সমাধান দিয়েছেন।

যেহেতু কোন মেমরি স্ট্রাকচার সবচেয়ে ভালো, সেটা জানা নেই, তাই এজেন্ট নিজেই Python কোড লিখে ডিজাইন করুক।

এই নতুন পদ্ধতির নাম ALMA (Automated meta-Learning of Memory designs for Agentic systems)।

ADAS থেকে ALMA: কোড-ভিত্তিক অটোমেটেড ডিজাইন

ALMA হল এই দলের সাম্প্রতিক AI জেনারেটিং অ্যালগরিদম টেকনিকের একটি ধারাবাহিকতা।

ADAS

ADAS (Automated Design of Agentic Systems)-এ, দলটি প্রমাণ করেছে যে এজেন্ট আর্কিটেকচার ডিজাইন করার সময়, কোড হল নিউরাল নেটওয়ার্কের ওজন বা সফট প্রম্পটের চেয়েও বেশি কার্যকর একটি সার্চ স্পেস। কোডের টিউরিং কমপ্লিটনেস আছে এবং এটি খুব সহজেই ব্যাখ্যা করা যায়।

মেটা এজেন্ট

এরপর DGM (Darwin Gödel Machine)-এ, দলটি ইভোল্যুশনারি অ্যালগরিদমের ওপেন-এন্ডেড এক্সপ্লোরেশন ধারণাটি নিয়ে আসে। এখানে একটি ডিজাইন আর্কাইভ তৈরি করা হয়, যা মডেলকে নতুন সমাধান খুঁজতে উৎসাহিত করে।

DGM

ALMA, ADAS-এর কোড জেনারেশন প্যারাডাইম এবং DGM-এর ইভোল্যুশনারি স্ট্র্যাটেজি গ্রহণ করে, এবং এজেন্ট সিস্টেমের সেই কম্পোনেন্টগুলোর ওপর ফোকাস করে যেখানে মানুষের অভিজ্ঞতার প্রয়োজন সবচেয়ে বেশি—যেমন মেমরি।

ALMA কিভাবে কাজ করে

ALMA-র কাজের পদ্ধতি হল একটি স্ট্যান্ডার্ড মেটা-লার্নিং ক্লোজড লুপ। মেটা এজেন্ট সরাসরি টাস্ক হ্যান্ডেল না করে, প্রোগ্রামিংয়ের দায়িত্ব নেয়। এই প্রক্রিয়ায় চারটি ধাপ আছে:

ধারণা তৈরি করা: বর্তমান মেমরি ডিজাইন আর্কাইভ বিশ্লেষণ করে, অতীতের পারফরম্যান্সের ওপর ভিত্তি করে উন্নতির পরিকল্পনা করা।
পরিকল্পনা: পরিকল্পনাটিকে ছদ্ম কোড লজিকে রূপান্তরিত করা।
বাস্তবায়ন: কার্যকরী Python কোড লেখা, মূল ফাংশনগুলো সংজ্ঞায়িত করা।
মূল্যায়ন: তৈরি করা কোড স্যান্ডবক্স পরিবেশে স্থাপন করে টাস্ক সম্পাদন করা এবং পারফরম্যান্সের সূচকগুলোর ফিডব্যাক দেওয়া।

ওয়ার্কফ্লো

ইভোল্যুশন প্রক্রিয়ায়, ALMA একটি বিশাল ডিজাইন ট্রি তৈরি করে। ইটারেশন সংখ্যা বাড়ার সাথে সাথে, তৈরি হওয়া মেমরি কোড ধীরে ধীরে সাধারণ স্টোরেজ লজিক থেকে জটিল কগনিটিভ আর্কিটেকচারে পরিণত হয়।

ইভোল্যুশন ট্রি

তৈরি হওয়া মেমরি স্ট্রাকচার

ALMA দ্বারা তৈরি মেমরি ডিজাইন বিভিন্ন টাস্কে বিভিন্ন রকম পারফরম্যান্স দেখিয়েছে:

MiniHack (ডungeon exploration): রিস্ক এবং ইন্টার‍্যাকশন মডিউল ডিজাইন করেছে, যা স্পষ্টভাবে রক্তক্ষরণের কারণ হওয়া অপারেশন এবং দানবদের আক্রমণাত্মক মনোভাব রেকর্ড করে।
Baba Is AI (লজিক পাজল): স্ট্র্যাটেজি লাইব্রেরি ডিজাইন করেছে, যা লেভেল পার করার জন্য প্রয়োজনীয় নিয়মগুলোর কম্বিনেশন রেকর্ড করে।

মেমরি স্ট্রাকচার

এ থেকে বোঝা যায় যে AI টাস্কের বৈশিষ্ট্যগুলো চিনতে পারে: সার্ভাইভাল গেমের জন্য ঝুঁকির দিকে মনোযোগ দিতে হয়, আর পাজল গেমের জন্য নিয়মগুলো বুঝতে হয়।

পরীক্ষার ফলাফল

TextWorld, ALFWorld, MiniHack, Baba Is AI এই চারটি পরিবেশে ALMA-র সাথে অন্যান্য বেসলাইনের তুলনা করা হয়েছে।

GPT-5-mini মডেলে, ALMA-র গড় সাফল্যের হার 53.9%, যা G-Memory (46.0%) এবং Trajectory Retrieval (48.6%) থেকে ভালো।

পরীক্ষার ফলাফল

খরচের দিক থেকে, ALMA গড়ে মাত্র 1,319 টোকেন ব্যবহার করে, যেখানে Trajectory Retrieval 9,149 টোকেন এবং G-Memory 6,055 টোকেন ব্যবহার করে। ALMA প্রায় 1/7 থেকে 1/5 খরচ করে আরও ভালো পারফরম্যান্স দেয়।

খরচের দক্ষতা

উপসংহার

ALMA, Software 2.0 (Neural Networks) থেকে Software 3.0 (AI-Generating Algorithms)-এ যাওয়ার একটি সম্ভাবনা দেখাচ্ছে।

এজেন্ট ডেভেলপমেন্টে, মেমরি মডিউলের ডিজাইন দীর্ঘদিন ধরে ইঞ্জিনিয়ারদের ওপর নির্ভরশীল ছিল। ALMA প্রমাণ করেছে যে মেটা-লার্নিং এবং কোড জেনারেশনের মাধ্যমে, AI নির্দিষ্ট পরিবেশের জন্য সবচেয়ে ভালো মেমরি আর্কিটেকচার খুঁজে বের করতে পারে।

রিসোর্স লিঙ্ক

পেপার: https://arxiv.org/pdf/2602.07755
কোড: https://github.com/zksha/alma
প্রোজেক্টের মূল পাতা: https://yimingxiong.me/alma

ADAS থেকে ALMA: কোড-ভিত্তিক অটোমেটেড ডিজাইন

ALMA কিভাবে কাজ করে

তৈরি হওয়া মেমরি স্ট্রাকচার

পরীক্ষার ফলাফল

উপসংহার

রিসোর্স লিঙ্ক

You Might Also Like

Claude Code Buddy পরিবর্তন নির্দেশিকা: কিভাবে ফ্ল্যাশ লিজেন্ডারি পেট পেতে হয়

Obsidian Defuddle চালু করেছে, Obsidian Web Clipper কে একটি নতুন উচ্চতায় নিয়ে গেছে

2026, নিজেকে 'শৃঙ্খলা' করতে আর চাপ দেবেন না! এই 8টি ছোট কাজ করুন, স্বাস্থ্য স্বাভাবিকভাবেই আসবে

যে সব মায়েরা কঠোর পরিশ্রম করেও ওজন কমাতে পারছেন না, তারা এখানে পড়ে যাচ্ছেন

AI Browser 24 ঘণ্টা স্থিতিশীল চলাচলের নির্দেশিকা