প্যারামিটার টিউনিং ছাড়াই, শুধু কোড লিখুন! জেফ ক্লাউনের দলের নতুন কাজ: মেটা এজেন্ট স্বয়ংক্রিয়ভাবে মেমরি মডিউল তৈরি করে
প্যারামিটার টিউনিং ছাড়াই, শুধু কোড লিখুন! জেফ ক্লাউনের দলের নতুন কাজ: মেটা এজেন্ট স্বয়ংক্রিয়ভাবে মেমরি মডিউল তৈরি করে
Software 3.0-এর দিকে, AI নিজেই Python কোড লিখে মস্তিষ্ককে উন্নত করছে।

এজেন্ট ডেভলপমেন্টের গভীরে, মেমরি (Memory) সবসময় একটি গুরুত্বপূর্ণ বিষয়।
বেসিক মডেলের ক্ষমতা দিন দিন বাড়লেও, যুক্তির ক্ষেত্রে এটি মূলত স্টেটলেস (Stateless), যা এজেন্টকে ক্রমাগত অভিজ্ঞতা অর্জনে বাধা দেয়।
বর্তমানে মেমরি নিয়ে কাজ করার জন্য RAG বা উইন্ডো সামারাইজেশনের মতো যে পদ্ধতিগুলো আছে, সেগুলো মূলত মানুষের তৈরি করা নিয়ম-নীতির ওপর ভিত্তি করে তৈরি।
এইভাবে হাতে তৈরি করা মেমরি মডিউলগুলো খুবই দুর্বল এবং স্থানান্তর করা কঠিন। ডায়ালগ সিস্টেমের জন্য তৈরি করা প্রম্পট এবং রিট্রিভাল লজিক, যখন লং-রেঞ্জ প্ল্যানিং টাস্কে (যেমন ALFWorld) বা জটিল স্ট্র্যাটেজি গেমসে ব্যবহার করা হয়, তখন প্রায়ই অকার্যকর হয়ে যায়।

এই সমস্যা সমাধানের জন্য UBC-র অধ্যাপক এবং OpenAI-এর প্রাক্তন গবেষক জেফ ক্লাউনের দল একটি দারুণ সমাধান দিয়েছেন।
যেহেতু কোন মেমরি স্ট্রাকচার সবচেয়ে ভালো, সেটা জানা নেই, তাই এজেন্ট নিজেই Python কোড লিখে ডিজাইন করুক।
এই নতুন পদ্ধতির নাম ALMA (Automated meta-Learning of Memory designs for Agentic systems)।
ADAS থেকে ALMA: কোড-ভিত্তিক অটোমেটেড ডিজাইন
ALMA হল এই দলের সাম্প্রতিক AI জেনারেটিং অ্যালগরিদম টেকনিকের একটি ধারাবাহিকতা।

ADAS (Automated Design of Agentic Systems)-এ, দলটি প্রমাণ করেছে যে এজেন্ট আর্কিটেকচার ডিজাইন করার সময়, কোড হল নিউরাল নেটওয়ার্কের ওজন বা সফট প্রম্পটের চেয়েও বেশি কার্যকর একটি সার্চ স্পেস। কোডের টিউরিং কমপ্লিটনেস আছে এবং এটি খুব সহজেই ব্যাখ্যা করা যায়।

এরপর DGM (Darwin Gödel Machine)-এ, দলটি ইভোল্যুশনারি অ্যালগরিদমের ওপেন-এন্ডেড এক্সপ্লোরেশন ধারণাটি নিয়ে আসে। এখানে একটি ডিজাইন আর্কাইভ তৈরি করা হয়, যা মডেলকে নতুন সমাধান খুঁজতে উৎসাহিত করে।

ALMA, ADAS-এর কোড জেনারেশন প্যারাডাইম এবং DGM-এর ইভোল্যুশনারি স্ট্র্যাটেজি গ্রহণ করে, এবং এজেন্ট সিস্টেমের সেই কম্পোনেন্টগুলোর ওপর ফোকাস করে যেখানে মানুষের অভিজ্ঞতার প্রয়োজন সবচেয়ে বেশি—যেমন মেমরি।
ALMA কিভাবে কাজ করে
ALMA-র কাজের পদ্ধতি হল একটি স্ট্যান্ডার্ড মেটা-লার্নিং ক্লোজড লুপ। মেটা এজেন্ট সরাসরি টাস্ক হ্যান্ডেল না করে, প্রোগ্রামিংয়ের দায়িত্ব নেয়। এই প্রক্রিয়ায় চারটি ধাপ আছে:
- ধারণা তৈরি করা: বর্তমান মেমরি ডিজাইন আর্কাইভ বিশ্লেষণ করে, অতীতের পারফরম্যান্সের ওপর ভিত্তি করে উন্নতির পরিকল্পনা করা।
- পরিকল্পনা: পরিকল্পনাটিকে ছদ্ম কোড লজিকে রূপান্তরিত করা।
- বাস্তবায়ন: কার্যকরী Python কোড লেখা, মূল ফাংশনগুলো সংজ্ঞায়িত করা।
- মূল্যায়ন: তৈরি করা কোড স্যান্ডবক্স পরিবেশে স্থাপন করে টাস্ক সম্পাদন করা এবং পারফরম্যান্সের সূচকগুলোর ফিডব্যাক দেওয়া।

ইভোল্যুশন প্রক্রিয়ায়, ALMA একটি বিশাল ডিজাইন ট্রি তৈরি করে। ইটারেশন সংখ্যা বাড়ার সাথে সাথে, তৈরি হওয়া মেমরি কোড ধীরে ধীরে সাধারণ স্টোরেজ লজিক থেকে জটিল কগনিটিভ আর্কিটেকচারে পরিণত হয়।

তৈরি হওয়া মেমরি স্ট্রাকচার
ALMA দ্বারা তৈরি মেমরি ডিজাইন বিভিন্ন টাস্কে বিভিন্ন রকম পারফরম্যান্স দেখিয়েছে:
- MiniHack (ডungeon exploration): রিস্ক এবং ইন্টার্যাকশন মডিউল ডিজাইন করেছে, যা স্পষ্টভাবে রক্তক্ষরণের কারণ হওয়া অপারেশন এবং দানবদের আক্রমণাত্মক মনোভাব রেকর্ড করে।
- Baba Is AI (লজিক পাজল): স্ট্র্যাটেজি লাইব্রেরি ডিজাইন করেছে, যা লেভেল পার করার জন্য প্রয়োজনীয় নিয়মগুলোর কম্বিনেশন রেকর্ড করে।

এ থেকে বোঝা যায় যে AI টাস্কের বৈশিষ্ট্যগুলো চিনতে পারে: সার্ভাইভাল গেমের জন্য ঝুঁকির দিকে মনোযোগ দিতে হয়, আর পাজল গেমের জন্য নিয়মগুলো বুঝতে হয়।
পরীক্ষার ফলাফল
TextWorld, ALFWorld, MiniHack, Baba Is AI এই চারটি পরিবেশে ALMA-র সাথে অন্যান্য বেসলাইনের তুলনা করা হয়েছে।
GPT-5-mini মডেলে, ALMA-র গড় সাফল্যের হার 53.9%, যা G-Memory (46.0%) এবং Trajectory Retrieval (48.6%) থেকে ভালো।

খরচের দিক থেকে, ALMA গড়ে মাত্র 1,319 টোকেন ব্যবহার করে, যেখানে Trajectory Retrieval 9,149 টোকেন এবং G-Memory 6,055 টোকেন ব্যবহার করে। ALMA প্রায় 1/7 থেকে 1/5 খরচ করে আরও ভালো পারফরম্যান্স দেয়।

উপসংহার
ALMA, Software 2.0 (Neural Networks) থেকে Software 3.0 (AI-Generating Algorithms)-এ যাওয়ার একটি সম্ভাবনা দেখাচ্ছে।
এজেন্ট ডেভেলপমেন্টে, মেমরি মডিউলের ডিজাইন দীর্ঘদিন ধরে ইঞ্জিনিয়ারদের ওপর নির্ভরশীল ছিল। ALMA প্রমাণ করেছে যে মেটা-লার্নিং এবং কোড জেনারেশনের মাধ্যমে, AI নির্দিষ্ট পরিবেশের জন্য সবচেয়ে ভালো মেমরি আর্কিটেকচার খুঁজে বের করতে পারে।
রিসোর্স লিঙ্ক
- পেপার: https://arxiv.org/pdf/2602.07755
- কোড: https://github.com/zksha/alma
- প্রোজেক্টের মূল পাতা: https://yimingxiong.me/alma





