প্যারামিটার টিউনিং ছাড়াই, শুধু কোড লিখুন! জেফ ক্লাউনের দলের নতুন কাজ: মেটা এজেন্ট স্বয়ংক্রিয়ভাবে মেমরি মডিউল তৈরি করে

2/14/2026
4 min read

প্যারামিটার টিউনিং ছাড়াই, শুধু কোড লিখুন! জেফ ক্লাউনের দলের নতুন কাজ: মেটা এজেন্ট স্বয়ংক্রিয়ভাবে মেমরি মডিউল তৈরি করে

Software 3.0-এর দিকে, AI নিজেই Python কোড লিখে মস্তিষ্ককে উন্নত করছে।

ALMA

এজেন্ট ডেভলপমেন্টের গভীরে, মেমরি (Memory) সবসময় একটি গুরুত্বপূর্ণ বিষয়।

বেসিক মডেলের ক্ষমতা দিন দিন বাড়লেও, যুক্তির ক্ষেত্রে এটি মূলত স্টেটলেস (Stateless), যা এজেন্টকে ক্রমাগত অভিজ্ঞতা অর্জনে বাধা দেয়।

বর্তমানে মেমরি নিয়ে কাজ করার জন্য RAG বা উইন্ডো সামারাইজেশনের মতো যে পদ্ধতিগুলো আছে, সেগুলো মূলত মানুষের তৈরি করা নিয়ম-নীতির ওপর ভিত্তি করে তৈরি।

এইভাবে হাতে তৈরি করা মেমরি মডিউলগুলো খুবই দুর্বল এবং স্থানান্তর করা কঠিন। ডায়ালগ সিস্টেমের জন্য তৈরি করা প্রম্পট এবং রিট্রিভাল লজিক, যখন লং-রেঞ্জ প্ল্যানিং টাস্কে (যেমন ALFWorld) বা জটিল স্ট্র্যাটেজি গেমসে ব্যবহার করা হয়, তখন প্রায়ই অকার্যকর হয়ে যায়।

ALMA আর্কিটেকচার

এই সমস্যা সমাধানের জন্য UBC-র অধ্যাপক এবং OpenAI-এর প্রাক্তন গবেষক জেফ ক্লাউনের দল একটি দারুণ সমাধান দিয়েছেন।

যেহেতু কোন মেমরি স্ট্রাকচার সবচেয়ে ভালো, সেটা জানা নেই, তাই এজেন্ট নিজেই Python কোড লিখে ডিজাইন করুক।

এই নতুন পদ্ধতির নাম ALMA (Automated meta-Learning of Memory designs for Agentic systems)।

ADAS থেকে ALMA: কোড-ভিত্তিক অটোমেটেড ডিজাইন

ALMA হল এই দলের সাম্প্রতিক AI জেনারেটিং অ্যালগরিদম টেকনিকের একটি ধারাবাহিকতা।

ADAS

ADAS (Automated Design of Agentic Systems)-এ, দলটি প্রমাণ করেছে যে এজেন্ট আর্কিটেকচার ডিজাইন করার সময়, কোড হল নিউরাল নেটওয়ার্কের ওজন বা সফট প্রম্পটের চেয়েও বেশি কার্যকর একটি সার্চ স্পেস। কোডের টিউরিং কমপ্লিটনেস আছে এবং এটি খুব সহজেই ব্যাখ্যা করা যায়।

মেটা এজেন্ট

এরপর DGM (Darwin Gödel Machine)-এ, দলটি ইভোল্যুশনারি অ্যালগরিদমের ওপেন-এন্ডেড এক্সপ্লোরেশন ধারণাটি নিয়ে আসে। এখানে একটি ডিজাইন আর্কাইভ তৈরি করা হয়, যা মডেলকে নতুন সমাধান খুঁজতে উৎসাহিত করে।

DGM

ALMA, ADAS-এর কোড জেনারেশন প্যারাডাইম এবং DGM-এর ইভোল্যুশনারি স্ট্র্যাটেজি গ্রহণ করে, এবং এজেন্ট সিস্টেমের সেই কম্পোনেন্টগুলোর ওপর ফোকাস করে যেখানে মানুষের অভিজ্ঞতার প্রয়োজন সবচেয়ে বেশি—যেমন মেমরি।

ALMA কিভাবে কাজ করে

ALMA-র কাজের পদ্ধতি হল একটি স্ট্যান্ডার্ড মেটা-লার্নিং ক্লোজড লুপ। মেটা এজেন্ট সরাসরি টাস্ক হ্যান্ডেল না করে, প্রোগ্রামিংয়ের দায়িত্ব নেয়। এই প্রক্রিয়ায় চারটি ধাপ আছে:

  • ধারণা তৈরি করা: বর্তমান মেমরি ডিজাইন আর্কাইভ বিশ্লেষণ করে, অতীতের পারফরম্যান্সের ওপর ভিত্তি করে উন্নতির পরিকল্পনা করা।
  • পরিকল্পনা: পরিকল্পনাটিকে ছদ্ম কোড লজিকে রূপান্তরিত করা।
  • বাস্তবায়ন: কার্যকরী Python কোড লেখা, মূল ফাংশনগুলো সংজ্ঞায়িত করা।
  • মূল্যায়ন: তৈরি করা কোড স্যান্ডবক্স পরিবেশে স্থাপন করে টাস্ক সম্পাদন করা এবং পারফরম্যান্সের সূচকগুলোর ফিডব্যাক দেওয়া।

ওয়ার্কফ্লো

ইভোল্যুশন প্রক্রিয়ায়, ALMA একটি বিশাল ডিজাইন ট্রি তৈরি করে। ইটারেশন সংখ্যা বাড়ার সাথে সাথে, তৈরি হওয়া মেমরি কোড ধীরে ধীরে সাধারণ স্টোরেজ লজিক থেকে জটিল কগনিটিভ আর্কিটেকচারে পরিণত হয়।

ইভোল্যুশন ট্রি

তৈরি হওয়া মেমরি স্ট্রাকচার

ALMA দ্বারা তৈরি মেমরি ডিজাইন বিভিন্ন টাস্কে বিভিন্ন রকম পারফরম্যান্স দেখিয়েছে:

  • MiniHack (ডungeon exploration): রিস্ক এবং ইন্টার‍্যাকশন মডিউল ডিজাইন করেছে, যা স্পষ্টভাবে রক্তক্ষরণের কারণ হওয়া অপারেশন এবং দানবদের আক্রমণাত্মক মনোভাব রেকর্ড করে।
  • Baba Is AI (লজিক পাজল): স্ট্র্যাটেজি লাইব্রেরি ডিজাইন করেছে, যা লেভেল পার করার জন্য প্রয়োজনীয় নিয়মগুলোর কম্বিনেশন রেকর্ড করে।

মেমরি স্ট্রাকচার

এ থেকে বোঝা যায় যে AI টাস্কের বৈশিষ্ট্যগুলো চিনতে পারে: সার্ভাইভাল গেমের জন্য ঝুঁকির দিকে মনোযোগ দিতে হয়, আর পাজল গেমের জন্য নিয়মগুলো বুঝতে হয়।

পরীক্ষার ফলাফল

TextWorld, ALFWorld, MiniHack, Baba Is AI এই চারটি পরিবেশে ALMA-র সাথে অন্যান্য বেসলাইনের তুলনা করা হয়েছে।

GPT-5-mini মডেলে, ALMA-র গড় সাফল্যের হার 53.9%, যা G-Memory (46.0%) এবং Trajectory Retrieval (48.6%) থেকে ভালো।

পরীক্ষার ফলাফল

খরচের দিক থেকে, ALMA গড়ে মাত্র 1,319 টোকেন ব্যবহার করে, যেখানে Trajectory Retrieval 9,149 টোকেন এবং G-Memory 6,055 টোকেন ব্যবহার করে। ALMA প্রায় 1/7 থেকে 1/5 খরচ করে আরও ভালো পারফরম্যান্স দেয়।

খরচের দক্ষতা

উপসংহার

ALMA, Software 2.0 (Neural Networks) থেকে Software 3.0 (AI-Generating Algorithms)-এ যাওয়ার একটি সম্ভাবনা দেখাচ্ছে।

এজেন্ট ডেভেলপমেন্টে, মেমরি মডিউলের ডিজাইন দীর্ঘদিন ধরে ইঞ্জিনিয়ারদের ওপর নির্ভরশীল ছিল। ALMA প্রমাণ করেছে যে মেটা-লার্নিং এবং কোড জেনারেশনের মাধ্যমে, AI নির্দিষ্ট পরিবেশের জন্য সবচেয়ে ভালো মেমরি আর্কিটেকচার খুঁজে বের করতে পারে।

রিসোর্স লিঙ্ক

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy পরিবর্তন নির্দেশিকা: কিভাবে ফ্ল্যাশ লিজেন্ডারি পেট পেতে হয়

Claude Code Buddy পরিবর্তন নির্দেশিকা: কিভাবে ফ্ল্যাশ লিজেন্ডারি পেট পেতে হয় 2026 সালের ১ এপ্রিল, Anthropic Claude Code...

Obsidian Defuddle চালু করেছে, Obsidian Web Clipper কে একটি নতুন উচ্চতায় নিয়ে গেছেTechnology

Obsidian Defuddle চালু করেছে, Obsidian Web Clipper কে একটি নতুন উচ্চতায় নিয়ে গেছে

Obsidian Defuddle চালু করেছে, Obsidian Web Clipper কে একটি নতুন উচ্চতায় নিয়ে গেছে আমি সবসময় Obsidian এর মূল ধারণা পছ...

OpenAI হঠাৎ ঘোষণা করেছে "তিন-এক": ব্রাউজার + প্রোগ্রামিং + ChatGPT একত্রিত, অভ্যন্তরীণভাবে স্বীকার করেছে গত এক বছরে ভুল পথে গিয়েছিলTechnology

OpenAI হঠাৎ ঘোষণা করেছে "তিন-এক": ব্রাউজার + প্রোগ্রামিং + ChatGPT একত্রিত, অভ্যন্তরীণভাবে স্বীকার করেছে গত এক বছরে ভুল পথে গিয়েছিল

OpenAI হঠাৎ ঘোষণা করেছে "তিন-এক": ব্রাউজার + প্রোগ্রামিং + ChatGPT একত্রিত, অভ্যন্তরীণভাবে স্বীকার করেছে গত এক বছরে ভুল ...

2026, নিজেকে 'শৃঙ্খলা' করতে আর চাপ দেবেন না! এই 8টি ছোট কাজ করুন, স্বাস্থ্য স্বাভাবিকভাবেই আসবেHealth

2026, নিজেকে 'শৃঙ্খলা' করতে আর চাপ দেবেন না! এই 8টি ছোট কাজ করুন, স্বাস্থ্য স্বাভাবিকভাবেই আসবে

2026, নিজেকে 'শৃঙ্খলা' করতে আর চাপ দেবেন না! এই 8টি ছোট কাজ করুন, স্বাস্থ্য স্বাভাবিকভাবেই আসবে নতুন বছরের শুরু, গত বছর...

যে সব মায়েরা কঠোর পরিশ্রম করেও ওজন কমাতে পারছেন না, তারা এখানে পড়ে যাচ্ছেনHealth

যে সব মায়েরা কঠোর পরিশ্রম করেও ওজন কমাতে পারছেন না, তারা এখানে পড়ে যাচ্ছেন

যে সব মায়েরা কঠোর পরিশ্রম করেও ওজন কমাতে পারছেন না, তারা এখানে পড়ে যাচ্ছেন মার্চ মাসের অর্ধেক পেরিয়ে গেছে, আপনার ওজন...

📝
Technology

AI Browser 24 ঘণ্টা স্থিতিশীল চলাচলের নির্দেশিকা

AI Browser 24 ঘণ্টা স্থিতিশীল চলাচলের নির্দেশিকা এই টিউটোরিয়ালটি একটি স্থিতিশীল, দীর্ঘমেয়াদী AI ব্রাউজার পরিবেশ কিভাবে...