Χωρίς ρύθμιση παραμέτρων, απλώς γράψτε κώδικα! Νέα δουλειά από την ομάδα του Jeff Clune: Αυτόματη εξέλιξη της μονάδας μνήμης από τον Meta Agent

2/14/2026
4 min read

Χωρίς ρύθμιση παραμέτρων, απλώς γράψτε κώδικα! Νέα δουλειά από την ομάδα του Jeff Clune: Αυτόματη εξέλιξη της μονάδας μνήμης από τον Meta Agent

Στον δρόμο προς το Software 3.0, η AI αρχίζει να γράφει μόνη της κώδικα Python για να εξελίξει τον εγκέφαλο.

ALMA

Στα βαθιά νερά της ανάπτυξης Agent, η μνήμη (Memory) είναι πάντα ένα αναπόφευκτο σημείο πόνου.

Παρόλο που οι δυνατότητες των βασικών μοντέλων γίνονται όλο και πιο ισχυρές, στην ουσία είναι stateless κατά τη διάρκεια της διαδικασίας συμπερασμού, γεγονός που περιορίζει την ικανότητα του Agent να συσσωρεύει συνεχώς εμπειρίες.

Οι κύριες λύσεις της βιομηχανίας για την επεξεργασία της μνήμης, είτε πρόκειται για RAG είτε για περίληψη συρόμενου παραθύρου, παραμένουν ουσιαστικά στο στάδιο των ευρετικών κανόνων που έχουν σχεδιαστεί χειροκίνητα.

Αυτή η χειροποίητη μονάδα μνήμης είναι εξαιρετικά εύθραυστη και δύσκολη στη μεταφορά. Η προσεκτικά ρυθμισμένη Prompt και η λογική ανάκτησης για συστήματα διαλόγου, συχνά αποτυγχάνουν άμεσα όταν τοποθετούνται σε εργασίες μακροπρόθεσμου σχεδιασμού (όπως το ALFWorld) ή σε σύνθετα παιχνίδια στρατηγικής.

Αρχιτεκτονική ALMA

Για να αντιμετωπίσει αυτό το δίλημμα, η ομάδα του Jeff Clune, καθηγητή στο UBC και πρώην ερευνητή της OpenAI, έδωσε μια geeky λύση.

Δεδομένου ότι δεν γνωρίζουμε ποια δομή μνήμης είναι η καλύτερη, ας αφήσουμε τον Agent να γράψει μόνος του κώδικα Python για να τη σχεδιάσει.

Αυτό είναι το ALMA (Automated meta-Learning of Memory designs for Agentic systems) που μόλις κυκλοφόρησε.

Από το ADAS στο ALMA: Αυτοματοποιημένος σχεδιασμός βασισμένος σε κώδικα

Το ALMA είναι μια συνέχεια της τεχνικής διαδρομής αλγορίθμων που δημιουργούνται από AI που προωθείται πρόσφατα από την ομάδα.

ADAS

Στο ADAS (Automated Design of Agentic Systems), η ομάδα απέδειξε ότι κατά το σχεδιασμό της αρχιτεκτονικής Agent, ο κώδικας είναι ένας πιο αποτελεσματικός χώρος αναζήτησης από τα νευρωνικά βάρη ή τα Soft Prompts. Ο κώδικας έχει πληρότητα Turing και έχει εξαιρετική επεξηγηματικότητα.

Meta Agent

Στη συνέχεια, στο DGM (Darwin Gödel Machine), η ομάδα εισήγαγε την έννοια της ανοιχτής εξερεύνησης από τους εξελικτικούς αλγορίθμους, διατηρώντας ένα αρχείο σχεδιασμού και ενθαρρύνοντας το μοντέλο να εξερευνήσει νέες λύσεις.

DGM

Το ALMA κληρονομεί το παράδειγμα δημιουργίας κώδικα του ADAS και τη στρατηγική εξέλιξης του DGM, εστιάζοντας το σενάριο εφαρμογής στο στοιχείο του συστήματος Agent που βασίζεται περισσότερο στην ανθρώπινη εμπειρία - τη μνήμη.

Ο μηχανισμός λειτουργίας του ALMA

Ο μηχανισμός λειτουργίας του ALMA είναι ένας τυπικός μετα-μαθησιακός βρόχος. Ο Meta Agent δεν χειρίζεται πλέον απευθείας τις εργασίες, αλλά είναι υπεύθυνος για τον προγραμματισμό. Η διαδικασία περιλαμβάνει τέσσερα στάδια:

  • Σύλληψη: Αναλύστε το τρέχον αρχείο σχεδιασμού μνήμης και σκεφτείτε βελτιώσεις με βάση την ιστορική απόδοση
  • Σχεδιασμός: Μετατρέψτε τις ιδέες σε λογική ψευδοκώδικα
  • Υλοποίηση: Γράψτε εκτελέσιμο κώδικα Python, ορίστε βασικές συναρτήσεις
  • Αξιολόγηση: Αναπτύξτε τον δημιουργημένο κώδικα σε ένα περιβάλλον sandbox για να εκτελέσετε εργασίες και να αναφέρετε μετρήσεις απόδοσης

Ροή εργασίας

Κατά τη διάρκεια της διαδικασίας εξέλιξης, το ALMA θα δημιουργήσει ένα τεράστιο δέντρο σχεδιασμού. Καθώς αυξάνεται ο αριθμός των επαναλήψεων, ο δημιουργημένος κώδικας μνήμης εξελίσσεται σταδιακά από απλή λογική αποθήκευσης σε μια σύνθετη γνωστική αρχιτεκτονική.

Εξελικτικό δέντρο

Εξελιγμένες δομές μνήμης

Τα σχέδια μνήμης που δημιουργούνται από το ALMA έχουν δείξει τεράστιες διαφορές σε διαφορετικές εργασίες:

  • MiniHack (περιπέτεια μπουντρουμιού): Σχεδίασε μια μονάδα Risk and Interaction, καταγράφοντας ρητά τις λειτουργίες που προκαλούν απώλεια αίματος και την επιθετικότητα των τεράτων
  • Baba Is AI (λογικό παζλ): Σχεδίασε μια Strategy Library, καταγράφοντας τους συνδυασμούς κανόνων που απαιτούνται για να περάσετε τα επίπεδα

Δομή μνήμης

Αυτό δείχνει ότι η AI μπορεί να αναγνωρίσει τα χαρακτηριστικά της εργασίας: τα παιχνίδια επιβίωσης πρέπει να εστιάζουν στον κίνδυνο και τα παιχνίδια παζλ πρέπει να εστιάζουν στην αφαίρεση κανόνων.

Αποτελέσματα πειραμάτων

Το ALMA συγκρίθηκε με τις κύριες γραμμές βάσης σε τέσσερα περιβάλλοντα: TextWorld, ALFWorld, MiniHack, Baba Is AI.

Στο μοντέλο GPT-5-mini, το μέσο ποσοστό επιτυχίας του ALMA έφτασε το 53,9%, το οποίο είναι καλύτερο από το G-Memory (46,0%) και το Trajectory Retrieval (48,6%).

Αποτελέσματα πειραμάτων

Όσον αφορά την αποδοτικότητα κόστους, το ALMA καταναλώνει κατά μέσο όρο μόνο 1.319 tokens, ενώ το Trajectory Retrieval καταναλώνει έως και 9.149 tokens και το G-Memory φτάνει επίσης τα 6.055 tokens. Το ALMA πέτυχε καλύτερη απόδοση με περίπου 1/7 έως 1/5 του κόστους.

Αποδοτικότητα κόστους

Συμπέρασμα

Το ALMA δείχνει μια πιθανή μετάβαση από το Software 2.0 (Neural Networks) στο Software 3.0 (AI-Generating Algorithms).

Στην ανάπτυξη Agent, ο σχεδιασμός της μονάδας μνήμης βασιζόταν για μεγάλο χρονικό διάστημα στη διαίσθηση των μηχανικών. Το ALMA απέδειξε ότι μέσω της μετα-μάθησης και της δημιουργίας κώδικα, η AI μπορεί να ανακαλύψει αυτόματα την καλύτερη αρχιτεκτονική μνήμης σύμφωνα με το συγκεκριμένο περιβάλλον.

Σύνδεσμοι πόρων

Published in Technology

You Might Also Like

Πώς να χρησιμοποιήσετε την τεχνολογία υπολογιστικού νέφους: Ο πλήρης οδηγός για την κατασκευή της πρώτης σας υποδομής νέφουςTechnology

Πώς να χρησιμοποιήσετε την τεχνολογία υπολογιστικού νέφους: Ο πλήρης οδηγός για την κατασκευή της πρώτης σας υποδομής νέφους

[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLD...

Προειδοποίηση! Ο πατέρας του Claude Code δηλώνει: Σε 1 μήνα, χωρίς το Plan Mode, ο τίτλος του λογισμικού μηχανικού θα εξαφανιστείTechnology

Προειδοποίηση! Ο πατέρας του Claude Code δηλώνει: Σε 1 μήνα, χωρίς το Plan Mode, ο τίτλος του λογισμικού μηχανικού θα εξαφανιστεί

Προειδοποίηση! Ο πατέρας του Claude Code δηλώνει: Σε 1 μήνα, χωρίς το Plan Mode, ο τίτλος του λογισμικού μηχανικού θα εξ...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026年 Top 10 AI 代理:核心卖点解析Technology

2026年 Top 10 AI 代理:核心卖点解析

2026年 Top 10 AI 代理:核心卖点解析 引言 Με την ταχεία ανάπτυξη της τεχνητής νοημοσύνης, οι AI代理 (AI Agents) έχουν γίνει ένα καυτό θ...

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力Technology

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力 在技术飞速发展的今天,人工智能(AI)已成为各行各业的热门话题。从医疗健康到金融服务,从教育到娱乐,AI 工具正在改变我们工作的方式。为此,我们整理出2026年值得关注的十大...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 在快速发展的云计算领域,Amazon Web Services (AWS) 一直是领军者,提供丰富的服务和工具,帮助开发者、企业和技术专家在云上有效工作。以下是2026年值得关注的十大AWS工...