Χωρίς ρύθμιση παραμέτρων, απλώς γράψτε κώδικα! Νέα δουλειά από την ομάδα του Jeff Clune: Αυτόματη εξέλιξη της μονάδας μνήμης από τον Meta Agent

Στον δρόμο προς το Software 3.0, η AI αρχίζει να γράφει μόνη της κώδικα Python για να εξελίξει τον εγκέφαλο.

ALMA

Στα βαθιά νερά της ανάπτυξης Agent, η μνήμη (Memory) είναι πάντα ένα αναπόφευκτο σημείο πόνου.

Παρόλο που οι δυνατότητες των βασικών μοντέλων γίνονται όλο και πιο ισχυρές, στην ουσία είναι stateless κατά τη διάρκεια της διαδικασίας συμπερασμού, γεγονός που περιορίζει την ικανότητα του Agent να συσσωρεύει συνεχώς εμπειρίες.

Οι κύριες λύσεις της βιομηχανίας για την επεξεργασία της μνήμης, είτε πρόκειται για RAG είτε για περίληψη συρόμενου παραθύρου, παραμένουν ουσιαστικά στο στάδιο των ευρετικών κανόνων που έχουν σχεδιαστεί χειροκίνητα.

Αυτή η χειροποίητη μονάδα μνήμης είναι εξαιρετικά εύθραυστη και δύσκολη στη μεταφορά. Η προσεκτικά ρυθμισμένη Prompt και η λογική ανάκτησης για συστήματα διαλόγου, συχνά αποτυγχάνουν άμεσα όταν τοποθετούνται σε εργασίες μακροπρόθεσμου σχεδιασμού (όπως το ALFWorld) ή σε σύνθετα παιχνίδια στρατηγικής.

Αρχιτεκτονική ALMA

Για να αντιμετωπίσει αυτό το δίλημμα, η ομάδα του Jeff Clune, καθηγητή στο UBC και πρώην ερευνητή της OpenAI, έδωσε μια geeky λύση.

Δεδομένου ότι δεν γνωρίζουμε ποια δομή μνήμης είναι η καλύτερη, ας αφήσουμε τον Agent να γράψει μόνος του κώδικα Python για να τη σχεδιάσει.

Αυτό είναι το ALMA (Automated meta-Learning of Memory designs for Agentic systems) που μόλις κυκλοφόρησε.

Από το ADAS στο ALMA: Αυτοματοποιημένος σχεδιασμός βασισμένος σε κώδικα

Το ALMA είναι μια συνέχεια της τεχνικής διαδρομής αλγορίθμων που δημιουργούνται από AI που προωθείται πρόσφατα από την ομάδα.

ADAS

Στο ADAS (Automated Design of Agentic Systems), η ομάδα απέδειξε ότι κατά το σχεδιασμό της αρχιτεκτονικής Agent, ο κώδικας είναι ένας πιο αποτελεσματικός χώρος αναζήτησης από τα νευρωνικά βάρη ή τα Soft Prompts. Ο κώδικας έχει πληρότητα Turing και έχει εξαιρετική επεξηγηματικότητα.

Meta Agent

Στη συνέχεια, στο DGM (Darwin Gödel Machine), η ομάδα εισήγαγε την έννοια της ανοιχτής εξερεύνησης από τους εξελικτικούς αλγορίθμους, διατηρώντας ένα αρχείο σχεδιασμού και ενθαρρύνοντας το μοντέλο να εξερευνήσει νέες λύσεις.

DGM

Το ALMA κληρονομεί το παράδειγμα δημιουργίας κώδικα του ADAS και τη στρατηγική εξέλιξης του DGM, εστιάζοντας το σενάριο εφαρμογής στο στοιχείο του συστήματος Agent που βασίζεται περισσότερο στην ανθρώπινη εμπειρία - τη μνήμη.

Ο μηχανισμός λειτουργίας του ALMA

Ο μηχανισμός λειτουργίας του ALMA είναι ένας τυπικός μετα-μαθησιακός βρόχος. Ο Meta Agent δεν χειρίζεται πλέον απευθείας τις εργασίες, αλλά είναι υπεύθυνος για τον προγραμματισμό. Η διαδικασία περιλαμβάνει τέσσερα στάδια:

Σύλληψη: Αναλύστε το τρέχον αρχείο σχεδιασμού μνήμης και σκεφτείτε βελτιώσεις με βάση την ιστορική απόδοση
Σχεδιασμός: Μετατρέψτε τις ιδέες σε λογική ψευδοκώδικα
Υλοποίηση: Γράψτε εκτελέσιμο κώδικα Python, ορίστε βασικές συναρτήσεις
Αξιολόγηση: Αναπτύξτε τον δημιουργημένο κώδικα σε ένα περιβάλλον sandbox για να εκτελέσετε εργασίες και να αναφέρετε μετρήσεις απόδοσης

Ροή εργασίας

Κατά τη διάρκεια της διαδικασίας εξέλιξης, το ALMA θα δημιουργήσει ένα τεράστιο δέντρο σχεδιασμού. Καθώς αυξάνεται ο αριθμός των επαναλήψεων, ο δημιουργημένος κώδικας μνήμης εξελίσσεται σταδιακά από απλή λογική αποθήκευσης σε μια σύνθετη γνωστική αρχιτεκτονική.

Εξελικτικό δέντρο

Εξελιγμένες δομές μνήμης

Τα σχέδια μνήμης που δημιουργούνται από το ALMA έχουν δείξει τεράστιες διαφορές σε διαφορετικές εργασίες:

MiniHack (περιπέτεια μπουντρουμιού): Σχεδίασε μια μονάδα Risk and Interaction, καταγράφοντας ρητά τις λειτουργίες που προκαλούν απώλεια αίματος και την επιθετικότητα των τεράτων
Baba Is AI (λογικό παζλ): Σχεδίασε μια Strategy Library, καταγράφοντας τους συνδυασμούς κανόνων που απαιτούνται για να περάσετε τα επίπεδα

Δομή μνήμης

Αυτό δείχνει ότι η AI μπορεί να αναγνωρίσει τα χαρακτηριστικά της εργασίας: τα παιχνίδια επιβίωσης πρέπει να εστιάζουν στον κίνδυνο και τα παιχνίδια παζλ πρέπει να εστιάζουν στην αφαίρεση κανόνων.

Αποτελέσματα πειραμάτων

Το ALMA συγκρίθηκε με τις κύριες γραμμές βάσης σε τέσσερα περιβάλλοντα: TextWorld, ALFWorld, MiniHack, Baba Is AI.

Στο μοντέλο GPT-5-mini, το μέσο ποσοστό επιτυχίας του ALMA έφτασε το 53,9%, το οποίο είναι καλύτερο από το G-Memory (46,0%) και το Trajectory Retrieval (48,6%).

Αποτελέσματα πειραμάτων

Όσον αφορά την αποδοτικότητα κόστους, το ALMA καταναλώνει κατά μέσο όρο μόνο 1.319 tokens, ενώ το Trajectory Retrieval καταναλώνει έως και 9.149 tokens και το G-Memory φτάνει επίσης τα 6.055 tokens. Το ALMA πέτυχε καλύτερη απόδοση με περίπου 1/7 έως 1/5 του κόστους.

Αποδοτικότητα κόστους

Συμπέρασμα

Το ALMA δείχνει μια πιθανή μετάβαση από το Software 2.0 (Neural Networks) στο Software 3.0 (AI-Generating Algorithms).

Στην ανάπτυξη Agent, ο σχεδιασμός της μονάδας μνήμης βασιζόταν για μεγάλο χρονικό διάστημα στη διαίσθηση των μηχανικών. Το ALMA απέδειξε ότι μέσω της μετα-μάθησης και της δημιουργίας κώδικα, η AI μπορεί να ανακαλύψει αυτόματα την καλύτερη αρχιτεκτονική μνήμης σύμφωνα με το συγκεκριμένο περιβάλλον.

Σύνδεσμοι πόρων

Έγγραφο: https://arxiv.org/pdf/2602.07755
Κώδικας: https://github.com/zksha/alma
Αρχική σελίδα έργου: https://yimingxiong.me/alma

Χωρίς ρύθμιση παραμέτρων, απλώς γράψτε κώδικα! Νέα δουλειά από την ομάδα του Jeff Clune: Αυτόματη εξέλιξη της μονάδας μνήμης από τον Meta Agent

Χωρίς ρύθμιση παραμέτρων, απλώς γράψτε κώδικα! Νέα δουλειά από την ομάδα του Jeff Clune: Αυτόματη εξέλιξη της μονάδας μνήμης από τον Meta Agent

Από το ADAS στο ALMA: Αυτοματοποιημένος σχεδιασμός βασισμένος σε κώδικα

Ο μηχανισμός λειτουργίας του ALMA

Εξελιγμένες δομές μνήμης

Αποτελέσματα πειραμάτων

Συμπέρασμα

Σύνδεσμοι πόρων

You Might Also Like

Claude Code Buddy 修改指南：如何获得闪光传说级宠物

Obsidian παρουσίασε το Defuddle, ανεβάζοντας το Obsidian Web Clipper σε νέο επίπεδο

OpenAI ξαφνικά ανακοινώνει "τρίο σε ένα": Συνδυασμός περιηγητή + προγραμματισμού + ChatGPT, παραδέχεται ότι έκανε λάθος τον τελευταίο χρόνο

2026, μην πιέζεις τον εαυτό σου να είναι "πειθαρχημένος"! Κάνε αυτές τις 8 μικρές κινήσεις και η υγεία θα έρθει φυσικά

Οι μητέρες που προσπαθούν να χάσουν βάρος αλλά δεν τα καταφέρνουν, σίγουρα έχουν κολλήσει εδώ

AI Browser 24小时稳定运行指南