AutoAgent, eine Open-Source-Bibliothek von Kevin Gu bei thirdlayer.inc, ermöglicht es einem Meta-Agenten, das eigene Agenten-Framework autonom zu verbessern: Der Meta-Agent liest eine menschliche Direktive aus einer program.md-Datei, modifiziert iterativ die zentrale agent.py – inklusive System-Prompts, Tool-Definitionen und Routing-Logik –, führt Harbor-kompatible Benchmarks aus und behält oder verwirft Änderungen anhand gemessener Scores. In einem verifizierten 24-Stunden-Lauf erreichte das System Platz 1 auf SpreadsheetBench mit 96,5 Prozent und den besten GPT-5-Score auf TerminalBench mit 55,1 Prozent (Stand: April 2026).
- Mit der Open-Source-Bibliothek AutoAgent kann ein Meta-Agent sein eigenes Agenten-Framework völlig autonom anpassen.
- Menschen geben lediglich eine Direktive per Markdown-Datei vor, während die KI Code-Modifikationen selbst durchführt.
- In einem 24-Stunden-Lauf sicherte sich das autonome System Spitzenplätze bei SpreadsheetBench und TerminalBench.
Der Mechanismus folgt einem klaren Loop: Der Mensch agiert ausschließlich als "Director" und pflegt die program.md. Alles weitere – Hypothesenbildung, Harness-Modifikation, Benchmark-Ausführung via Docker und Ergebnis-Logging in results.tsv – übernimmt der Meta-Agent ohne weiteren menschlichen Eingriff. Die Architektur setzt auf eine feste Adapter-Schnittstelle zum Harbor-Benchmark-System und ist über Umgebungsvariablen mit mehreren LLM-Providern kompatibel, darunter die aktuellen Modelle von OpenAI und Anthropic. Entwickler Gu beschreibt den Ansatz als Analogie zu Andrej Karpathys "autoresearch"-Konzept – nur angewendet auf Agenten-Engineering statt auf ML-Training.
❓ Häufig gestellte Fragen
📚 Quellen