প্যারামিটার টিউনিং ছাড়াই, শুধু কোড লিখুন! জেফ ক্লাউনের দলের নতুন কাজ: মেটা এজেন্ট স্বয়ংক্রিয়ভাবে মেমরি মডিউল তৈরি করে

2/14/2026
4 min read

প্যারামিটার টিউনিং ছাড়াই, শুধু কোড লিখুন! জেফ ক্লাউনের দলের নতুন কাজ: মেটা এজেন্ট স্বয়ংক্রিয়ভাবে মেমরি মডিউল তৈরি করে

Software 3.0-এর দিকে, AI নিজেই Python কোড লিখে মস্তিষ্ককে উন্নত করছে।

ALMA

এজেন্ট ডেভলপমেন্টের গভীরে, মেমরি (Memory) সবসময় একটি গুরুত্বপূর্ণ বিষয়।

বেসিক মডেলের ক্ষমতা দিন দিন বাড়লেও, যুক্তির ক্ষেত্রে এটি মূলত স্টেটলেস (Stateless), যা এজেন্টকে ক্রমাগত অভিজ্ঞতা অর্জনে বাধা দেয়।

বর্তমানে মেমরি নিয়ে কাজ করার জন্য RAG বা উইন্ডো সামারাইজেশনের মতো যে পদ্ধতিগুলো আছে, সেগুলো মূলত মানুষের তৈরি করা নিয়ম-নীতির ওপর ভিত্তি করে তৈরি।

এইভাবে হাতে তৈরি করা মেমরি মডিউলগুলো খুবই দুর্বল এবং স্থানান্তর করা কঠিন। ডায়ালগ সিস্টেমের জন্য তৈরি করা প্রম্পট এবং রিট্রিভাল লজিক, যখন লং-রেঞ্জ প্ল্যানিং টাস্কে (যেমন ALFWorld) বা জটিল স্ট্র্যাটেজি গেমসে ব্যবহার করা হয়, তখন প্রায়ই অকার্যকর হয়ে যায়।

ALMA আর্কিটেকচার

এই সমস্যা সমাধানের জন্য UBC-র অধ্যাপক এবং OpenAI-এর প্রাক্তন গবেষক জেফ ক্লাউনের দল একটি দারুণ সমাধান দিয়েছেন।

যেহেতু কোন মেমরি স্ট্রাকচার সবচেয়ে ভালো, সেটা জানা নেই, তাই এজেন্ট নিজেই Python কোড লিখে ডিজাইন করুক।

এই নতুন পদ্ধতির নাম ALMA (Automated meta-Learning of Memory designs for Agentic systems)।

ADAS থেকে ALMA: কোড-ভিত্তিক অটোমেটেড ডিজাইন

ALMA হল এই দলের সাম্প্রতিক AI জেনারেটিং অ্যালগরিদম টেকনিকের একটি ধারাবাহিকতা।

ADAS

ADAS (Automated Design of Agentic Systems)-এ, দলটি প্রমাণ করেছে যে এজেন্ট আর্কিটেকচার ডিজাইন করার সময়, কোড হল নিউরাল নেটওয়ার্কের ওজন বা সফট প্রম্পটের চেয়েও বেশি কার্যকর একটি সার্চ স্পেস। কোডের টিউরিং কমপ্লিটনেস আছে এবং এটি খুব সহজেই ব্যাখ্যা করা যায়।

মেটা এজেন্ট

এরপর DGM (Darwin Gödel Machine)-এ, দলটি ইভোল্যুশনারি অ্যালগরিদমের ওপেন-এন্ডেড এক্সপ্লোরেশন ধারণাটি নিয়ে আসে। এখানে একটি ডিজাইন আর্কাইভ তৈরি করা হয়, যা মডেলকে নতুন সমাধান খুঁজতে উৎসাহিত করে।

DGM

ALMA, ADAS-এর কোড জেনারেশন প্যারাডাইম এবং DGM-এর ইভোল্যুশনারি স্ট্র্যাটেজি গ্রহণ করে, এবং এজেন্ট সিস্টেমের সেই কম্পোনেন্টগুলোর ওপর ফোকাস করে যেখানে মানুষের অভিজ্ঞতার প্রয়োজন সবচেয়ে বেশি—যেমন মেমরি।

ALMA কিভাবে কাজ করে

ALMA-র কাজের পদ্ধতি হল একটি স্ট্যান্ডার্ড মেটা-লার্নিং ক্লোজড লুপ। মেটা এজেন্ট সরাসরি টাস্ক হ্যান্ডেল না করে, প্রোগ্রামিংয়ের দায়িত্ব নেয়। এই প্রক্রিয়ায় চারটি ধাপ আছে:

  • ধারণা তৈরি করা: বর্তমান মেমরি ডিজাইন আর্কাইভ বিশ্লেষণ করে, অতীতের পারফরম্যান্সের ওপর ভিত্তি করে উন্নতির পরিকল্পনা করা।
  • পরিকল্পনা: পরিকল্পনাটিকে ছদ্ম কোড লজিকে রূপান্তরিত করা।
  • বাস্তবায়ন: কার্যকরী Python কোড লেখা, মূল ফাংশনগুলো সংজ্ঞায়িত করা।
  • মূল্যায়ন: তৈরি করা কোড স্যান্ডবক্স পরিবেশে স্থাপন করে টাস্ক সম্পাদন করা এবং পারফরম্যান্সের সূচকগুলোর ফিডব্যাক দেওয়া।

ওয়ার্কফ্লো

ইভোল্যুশন প্রক্রিয়ায়, ALMA একটি বিশাল ডিজাইন ট্রি তৈরি করে। ইটারেশন সংখ্যা বাড়ার সাথে সাথে, তৈরি হওয়া মেমরি কোড ধীরে ধীরে সাধারণ স্টোরেজ লজিক থেকে জটিল কগনিটিভ আর্কিটেকচারে পরিণত হয়।

ইভোল্যুশন ট্রি

তৈরি হওয়া মেমরি স্ট্রাকচার

ALMA দ্বারা তৈরি মেমরি ডিজাইন বিভিন্ন টাস্কে বিভিন্ন রকম পারফরম্যান্স দেখিয়েছে:

  • MiniHack (ডungeon exploration): রিস্ক এবং ইন্টার‍্যাকশন মডিউল ডিজাইন করেছে, যা স্পষ্টভাবে রক্তক্ষরণের কারণ হওয়া অপারেশন এবং দানবদের আক্রমণাত্মক মনোভাব রেকর্ড করে।
  • Baba Is AI (লজিক পাজল): স্ট্র্যাটেজি লাইব্রেরি ডিজাইন করেছে, যা লেভেল পার করার জন্য প্রয়োজনীয় নিয়মগুলোর কম্বিনেশন রেকর্ড করে।

মেমরি স্ট্রাকচার

এ থেকে বোঝা যায় যে AI টাস্কের বৈশিষ্ট্যগুলো চিনতে পারে: সার্ভাইভাল গেমের জন্য ঝুঁকির দিকে মনোযোগ দিতে হয়, আর পাজল গেমের জন্য নিয়মগুলো বুঝতে হয়।

পরীক্ষার ফলাফল

TextWorld, ALFWorld, MiniHack, Baba Is AI এই চারটি পরিবেশে ALMA-র সাথে অন্যান্য বেসলাইনের তুলনা করা হয়েছে।

GPT-5-mini মডেলে, ALMA-র গড় সাফল্যের হার 53.9%, যা G-Memory (46.0%) এবং Trajectory Retrieval (48.6%) থেকে ভালো।

পরীক্ষার ফলাফল

খরচের দিক থেকে, ALMA গড়ে মাত্র 1,319 টোকেন ব্যবহার করে, যেখানে Trajectory Retrieval 9,149 টোকেন এবং G-Memory 6,055 টোকেন ব্যবহার করে। ALMA প্রায় 1/7 থেকে 1/5 খরচ করে আরও ভালো পারফরম্যান্স দেয়।

খরচের দক্ষতা

উপসংহার

ALMA, Software 2.0 (Neural Networks) থেকে Software 3.0 (AI-Generating Algorithms)-এ যাওয়ার একটি সম্ভাবনা দেখাচ্ছে।

এজেন্ট ডেভেলপমেন্টে, মেমরি মডিউলের ডিজাইন দীর্ঘদিন ধরে ইঞ্জিনিয়ারদের ওপর নির্ভরশীল ছিল। ALMA প্রমাণ করেছে যে মেটা-লার্নিং এবং কোড জেনারেশনের মাধ্যমে, AI নির্দিষ্ট পরিবেশের জন্য সবচেয়ে ভালো মেমরি আর্কিটেকচার খুঁজে বের করতে পারে।

রিসোর্স লিঙ্ক

Published in Technology

You Might Also Like

কিভাবে ক্লাউড কম্পিউটিং প্রযুক্তি ব্যবহার করবেন: আপনার প্রথম ক্লাউড অবকাঠামো নির্মাণের সম্পূর্ণ গাইডTechnology

কিভাবে ক্লাউড কম্পিউটিং প্রযুক্তি ব্যবহার করবেন: আপনার প্রথম ক্লাউড অবকাঠামো নির্মাণের সম্পূর্ণ গাইড

[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLD...

সতর্কতা! Claude Code এর জনক স্পষ্ট বললেন: ১ মাস পর Plan Mode ব্যবহার না করলে সফটওয়্যার ইঞ্জিনিয়ারের উপাধি বিলীন হয়ে যাবেTechnology

সতর্কতা! Claude Code এর জনক স্পষ্ট বললেন: ১ মাস পর Plan Mode ব্যবহার না করলে সফটওয়্যার ইঞ্জিনিয়ারের উপাধি বিলীন হয়ে যাবে

সতর্কতা! Claude Code এর জনক স্পষ্ট বললেন: ১ মাস পর Plan Mode ব্যবহার না করলে সফটওয়্যার ইঞ্জিনিয়ারের উপাধি বিলীন হয়ে য...

2026 সালের শীর্ষ 10 গভীর শিক্ষার সম্পদ সুপারিশTechnology

2026 সালের শীর্ষ 10 গভীর শিক্ষার সম্পদ সুপারিশ

2026 সালের শীর্ষ 10 গভীর শিক্ষার সম্পদ সুপারিশ গভীর শিক্ষার বিভিন্ন ক্ষেত্রে দ্রুত উন্নতির সাথে সাথে, আরও বেশি শেখার সম্...

2026 সালের শীর্ষ 10 AI এজেন্ট: মূল বিক্রয় পয়েন্ট বিশ্লেষণTechnology

2026 সালের শীর্ষ 10 AI এজেন্ট: মূল বিক্রয় পয়েন্ট বিশ্লেষণ

2026 সালের শীর্ষ 10 AI এজেন্ট: মূল বিক্রয় পয়েন্ট বিশ্লেষণ ভূমিকা কৃত্রিম বুদ্ধিমত্তার দ্রুত উন্নতির সাথে, AI এজেন্ট (A...

2026 সালের শীর্ষ 10 AI টুলের সুপারিশ: কৃত্রিম বুদ্ধিমত্তার প্রকৃত সম্ভাবনা মুক্ত করুনTechnology

2026 সালের শীর্ষ 10 AI টুলের সুপারিশ: কৃত্রিম বুদ্ধিমত্তার প্রকৃত সম্ভাবনা মুক্ত করুন

2026 সালের শীর্ষ 10 AI টুলের সুপারিশ: কৃত্রিম বুদ্ধিমত্তার প্রকৃত সম্ভাবনা মুক্ত করুন বর্তমান প্রযুক্তির দ্রুত উন্নয়নের...

2026 সালের শীর্ষ 10 AWS টুল এবং সম্পদ সুপারিশTechnology

2026 সালের শীর্ষ 10 AWS টুল এবং সম্পদ সুপারিশ

2026 সালের শীর্ষ 10 AWS টুল এবং সম্পদ সুপারিশ দ্রুত বিকাশমান ক্লাউড কম্পিউটিং ক্ষেত্রে, অ্যামাজন ওয়েব সার্ভিসেস (AWS) স...