Google Cloud AI Research hat zusammen mit Forschenden der University of Illinois Urbana-Champaign und der Yale University ReasoningBank vorgestellt. Dieses Gedächtnis-Framework soll KI-Agenten befähigen, aus ihren Erfahrungen zu lernen und daraus verallgemeinerbare Strategien abzuleiten. Bisherige KI-Agenten haben oft ein „Amnesie-Problem“, bei dem sie jede Aufgabe neu angehen, selbst wenn sie ähnliche Probleme bereits bearbeitet haben. Dadurch wiederholen sie Fehler und verlieren wertvolle Erkenntnisse nach Abschluss einer Aufgabe.
- Google Cloud AI hat mit ReasoningBank ein Framework entwickelt, das KI-Agenten mit einem strategischen Gedächtnis ausstattet.
- Das System überwindet das typische Amnesie-Problem, indem es aktiv Strategien aus erfolgreichen sowie fehlgeschlagenen Lösungswegen ableitet.
- Experimente zeigen, dass beim Abruf solcher Erinnerungen die Qualität entscheidender ist als die Quantität, um die Erfolgsquote des Agenten zu steigern.
ReasoningBank zielt darauf ab, nicht nur die Aktionen eines Agenten zu speichern, sondern auch die Gründe für Erfolg oder Misserfolg zu destillieren. Dies unterscheidet sich von bestehenden Ansätzen wie Trajektoriengedächtnissen, die lediglich Aktionsprotokolle speichern, oder Workflow-Gedächtnissen, die nur aus erfolgreichen Abläufen lernen. Letztere ignorieren die Lernsignale, die in Misserfolgen liegen, obwohl Agenten häufig scheitern.
Das Framework arbeitet in einem geschlossenen Kreislauf mit drei Phasen: Gedächtnisabruf, Gedächtnisextraktion und Gedächtniskonsolidierung. Bevor ein Agent eine neue Aufgabe beginnt, fragt er ReasoningBank ab und ruft relevante Gedächtniseinträge ab. Diese werden als zusätzlicher Kontext in den System-Prompt des Agenten integriert. Experimente zeigen, dass die Qualität der abgerufenen Erinnerung wichtiger ist als die Quantität; das Abrufen von mehr als einem Element kann die Erfolgsquote sogar senken.
Nach Abschluss einer Aufgabe analysiert ein Memory Extractor, der auf demselben Large Language Model (LLM) wie der Agent basiert, die Trajektorie. Er destilliert sie in strukturierte Gedächtniseinträge, die einen Titel, eine Beschreibung und den Inhalt der destillierten Schritte oder Erkenntnisse umfassen. Dabei werden erfolgreiche und fehlgeschlagene Trajektorien unterschiedlich behandelt: Erfolge liefern validierte Strategien, während Misserfolge präventive Lehren und Fallstricke aufzeigen. Ein LLM-as-a-Judge bewertet dabei, ob eine Aufgabe erfolgreich war oder nicht.
Die bereitgestellte Quelle ist kompakt und erlaubt keine weiteren Details zu den Implementierungsaspekten oder konkreten Anwendungsfällen über die genannten Beispiele hinaus.
❓ Häufig gestellte Fragen
✅ 11 Claims geprüft, davon 5 mehrfach verifiziert
📚 Quellen