Χωρίς ρύθμιση παραμέτρων, απλώς γράψτε κώδικα! Νέα δουλειά από την ομάδα του Jeff Clune: Αυτόματη εξέλιξη της μονάδας μνήμης από τον Meta Agent
Χωρίς ρύθμιση παραμέτρων, απλώς γράψτε κώδικα! Νέα δουλειά από την ομάδα του Jeff Clune: Αυτόματη εξέλιξη της μονάδας μνήμης από τον Meta Agent
Στον δρόμο προς το Software 3.0, η AI αρχίζει να γράφει μόνη της κώδικα Python για να εξελίξει τον εγκέφαλο.

Στα βαθιά νερά της ανάπτυξης Agent, η μνήμη (Memory) είναι πάντα ένα αναπόφευκτο σημείο πόνου.
Παρόλο που οι δυνατότητες των βασικών μοντέλων γίνονται όλο και πιο ισχυρές, στην ουσία είναι stateless κατά τη διάρκεια της διαδικασίας συμπερασμού, γεγονός που περιορίζει την ικανότητα του Agent να συσσωρεύει συνεχώς εμπειρίες.
Οι κύριες λύσεις της βιομηχανίας για την επεξεργασία της μνήμης, είτε πρόκειται για RAG είτε για περίληψη συρόμενου παραθύρου, παραμένουν ουσιαστικά στο στάδιο των ευρετικών κανόνων που έχουν σχεδιαστεί χειροκίνητα.
Αυτή η χειροποίητη μονάδα μνήμης είναι εξαιρετικά εύθραυστη και δύσκολη στη μεταφορά. Η προσεκτικά ρυθμισμένη Prompt και η λογική ανάκτησης για συστήματα διαλόγου, συχνά αποτυγχάνουν άμεσα όταν τοποθετούνται σε εργασίες μακροπρόθεσμου σχεδιασμού (όπως το ALFWorld) ή σε σύνθετα παιχνίδια στρατηγικής.

Για να αντιμετωπίσει αυτό το δίλημμα, η ομάδα του Jeff Clune, καθηγητή στο UBC και πρώην ερευνητή της OpenAI, έδωσε μια geeky λύση.
Δεδομένου ότι δεν γνωρίζουμε ποια δομή μνήμης είναι η καλύτερη, ας αφήσουμε τον Agent να γράψει μόνος του κώδικα Python για να τη σχεδιάσει.
Αυτό είναι το ALMA (Automated meta-Learning of Memory designs for Agentic systems) που μόλις κυκλοφόρησε.
Από το ADAS στο ALMA: Αυτοματοποιημένος σχεδιασμός βασισμένος σε κώδικα
Το ALMA είναι μια συνέχεια της τεχνικής διαδρομής αλγορίθμων που δημιουργούνται από AI που προωθείται πρόσφατα από την ομάδα.

Στο ADAS (Automated Design of Agentic Systems), η ομάδα απέδειξε ότι κατά το σχεδιασμό της αρχιτεκτονικής Agent, ο κώδικας είναι ένας πιο αποτελεσματικός χώρος αναζήτησης από τα νευρωνικά βάρη ή τα Soft Prompts. Ο κώδικας έχει πληρότητα Turing και έχει εξαιρετική επεξηγηματικότητα.

Στη συνέχεια, στο DGM (Darwin Gödel Machine), η ομάδα εισήγαγε την έννοια της ανοιχτής εξερεύνησης από τους εξελικτικούς αλγορίθμους, διατηρώντας ένα αρχείο σχεδιασμού και ενθαρρύνοντας το μοντέλο να εξερευνήσει νέες λύσεις.

Το ALMA κληρονομεί το παράδειγμα δημιουργίας κώδικα του ADAS και τη στρατηγική εξέλιξης του DGM, εστιάζοντας το σενάριο εφαρμογής στο στοιχείο του συστήματος Agent που βασίζεται περισσότερο στην ανθρώπινη εμπειρία - τη μνήμη.
Ο μηχανισμός λειτουργίας του ALMA
Ο μηχανισμός λειτουργίας του ALMA είναι ένας τυπικός μετα-μαθησιακός βρόχος. Ο Meta Agent δεν χειρίζεται πλέον απευθείας τις εργασίες, αλλά είναι υπεύθυνος για τον προγραμματισμό. Η διαδικασία περιλαμβάνει τέσσερα στάδια:
- Σύλληψη: Αναλύστε το τρέχον αρχείο σχεδιασμού μνήμης και σκεφτείτε βελτιώσεις με βάση την ιστορική απόδοση
- Σχεδιασμός: Μετατρέψτε τις ιδέες σε λογική ψευδοκώδικα
- Υλοποίηση: Γράψτε εκτελέσιμο κώδικα Python, ορίστε βασικές συναρτήσεις
- Αξιολόγηση: Αναπτύξτε τον δημιουργημένο κώδικα σε ένα περιβάλλον sandbox για να εκτελέσετε εργασίες και να αναφέρετε μετρήσεις απόδοσης

Κατά τη διάρκεια της διαδικασίας εξέλιξης, το ALMA θα δημιουργήσει ένα τεράστιο δέντρο σχεδιασμού. Καθώς αυξάνεται ο αριθμός των επαναλήψεων, ο δημιουργημένος κώδικας μνήμης εξελίσσεται σταδιακά από απλή λογική αποθήκευσης σε μια σύνθετη γνωστική αρχιτεκτονική.

Εξελιγμένες δομές μνήμης
Τα σχέδια μνήμης που δημιουργούνται από το ALMA έχουν δείξει τεράστιες διαφορές σε διαφορετικές εργασίες:
- MiniHack (περιπέτεια μπουντρουμιού): Σχεδίασε μια μονάδα Risk and Interaction, καταγράφοντας ρητά τις λειτουργίες που προκαλούν απώλεια αίματος και την επιθετικότητα των τεράτων
- Baba Is AI (λογικό παζλ): Σχεδίασε μια Strategy Library, καταγράφοντας τους συνδυασμούς κανόνων που απαιτούνται για να περάσετε τα επίπεδα

Αυτό δείχνει ότι η AI μπορεί να αναγνωρίσει τα χαρακτηριστικά της εργασίας: τα παιχνίδια επιβίωσης πρέπει να εστιάζουν στον κίνδυνο και τα παιχνίδια παζλ πρέπει να εστιάζουν στην αφαίρεση κανόνων.
Αποτελέσματα πειραμάτων
Το ALMA συγκρίθηκε με τις κύριες γραμμές βάσης σε τέσσερα περιβάλλοντα: TextWorld, ALFWorld, MiniHack, Baba Is AI.
Στο μοντέλο GPT-5-mini, το μέσο ποσοστό επιτυχίας του ALMA έφτασε το 53,9%, το οποίο είναι καλύτερο από το G-Memory (46,0%) και το Trajectory Retrieval (48,6%).

Όσον αφορά την αποδοτικότητα κόστους, το ALMA καταναλώνει κατά μέσο όρο μόνο 1.319 tokens, ενώ το Trajectory Retrieval καταναλώνει έως και 9.149 tokens και το G-Memory φτάνει επίσης τα 6.055 tokens. Το ALMA πέτυχε καλύτερη απόδοση με περίπου 1/7 έως 1/5 του κόστους.

Συμπέρασμα
Το ALMA δείχνει μια πιθανή μετάβαση από το Software 2.0 (Neural Networks) στο Software 3.0 (AI-Generating Algorithms).
Στην ανάπτυξη Agent, ο σχεδιασμός της μονάδας μνήμης βασιζόταν για μεγάλο χρονικό διάστημα στη διαίσθηση των μηχανικών. Το ALMA απέδειξε ότι μέσω της μετα-μάθησης και της δημιουργίας κώδικα, η AI μπορεί να ανακαλύψει αυτόματα την καλύτερη αρχιτεκτονική μνήμης σύμφωνα με το συγκεκριμένο περιβάλλον.
Σύνδεσμοι πόρων
- Έγγραφο: https://arxiv.org/pdf/2602.07755
- Κώδικας: https://github.com/zksha/alma
- Αρχική σελίδα έργου: https://yimingxiong.me/alma





