AutoAgent: Open-Source-Bibliothek lässt KI ihr…

AutoAgent: Open-Source-Bibliothek lässt KI ihr eigenes Agenten-Framework optimieren

AutoAgent ist eine Open-Source-Bibliothek, die einen Meta-Agenten nutzt, um System-Prompts, Tools und Konfigurationen eines Agenten-Harness autonom zu iterieren – mit verifizierten Benchmark-Ergebnissen aus einem 24-Stunden-Lauf.

Jonas

10. April 2026, 03:15 Uhr ·2 Min. Lesezeit

AutoAgent, eine Open-Source-Bibliothek von Kevin Gu bei thirdlayer.inc, ermöglicht es einem Meta-Agenten, das eigene Agenten-Framework autonom zu verbessern: Der Meta-Agent liest eine menschliche Direktive aus einer program.md-Datei, modifiziert iterativ die zentrale agent.py – inklusive System-Prompts, Tool-Definitionen und Routing-Logik –, führt Harbor-kompatible Benchmarks aus und behält oder verwirft Änderungen anhand gemessener Scores. In einem verifizierten 24-Stunden-Lauf erreichte das System Platz 1 auf SpreadsheetBench mit 96,5 Prozent und den besten GPT-5-Score auf TerminalBench mit 55,1 Prozent (Stand: April 2026).

⚡ TL;DR

Mit der Open-Source-Bibliothek AutoAgent kann ein Meta-Agent sein eigenes Agenten-Framework völlig autonom anpassen.
Menschen geben lediglich eine Direktive per Markdown-Datei vor, während die KI Code-Modifikationen selbst durchführt.
In einem 24-Stunden-Lauf sicherte sich das autonome System Spitzenplätze bei SpreadsheetBench und TerminalBench.

Der Mechanismus folgt einem klaren Loop: Der Mensch agiert ausschließlich als "Director" und pflegt die program.md. Alles weitere – Hypothesenbildung, Harness-Modifikation, Benchmark-Ausführung via Docker und Ergebnis-Logging in results.tsv – übernimmt der Meta-Agent ohne weiteren menschlichen Eingriff. Die Architektur setzt auf eine feste Adapter-Schnittstelle zum Harbor-Benchmark-System und ist über Umgebungsvariablen mit mehreren LLM-Providern kompatibel, darunter die aktuellen Modelle von OpenAI und Anthropic. Entwickler Gu beschreibt den Ansatz als Analogie zu Andrej Karpathys "autoresearch"-Konzept – nur angewendet auf Agenten-Engineering statt auf ML-Training.

❓ Häufig gestellte Fragen

▶ Was genau ist AutoAgent und wie funktioniert es?

AutoAgent nutzt einen Meta-Agenten, um sein eigenes Framework kontinuierlich und autonom zu verbessern. Das System modifiziert eigenständig Quellcode wie System-Prompts oder Routing-Logik und verifiziert diese Änderungen umgehend in Benchmarks.

▶ Welche Rolle spielt ein menschlicher Entwickler noch in diesem Prozess?

Der Mensch agiert bei AutoAgent primär als Regisseur und gibt über eine einfache Markdown-Datei die gewünschten Ziele vor. Alle darauffolgenden Schritte wie Hypothesenbildung, Code-Anpassung und automatisierte Tests laufen komplett ohne menschliches Eingreifen ab.

▶ Wie erfolgreich ist die autonome Optimierung in der Praxis?

Der Ansatz liefert bereits äußerst überzeugende Ergebnisse in anspruchsvollen Benchmark-Tests. So erreichte AutoAgent in einem 24-Stunden-Lauf Platz 1 auf SpreadsheetBench und erzielte das beste GPT-5-Ergebnis auf TerminalBench.

📚 Quellen

Benchmarks

❓ Häufig gestellte Fragen

Das könnte dich auch interessieren

Anthropic Mythos: Cybersecurity-Risiko oder Enterprise-Strategie?

YouTube Shorts: KI-Avatare erlauben Creator-Skalierung ohne Kamera

Claude Code: Anthropic trennt OpenClaw-Nutzung vom Abo-Modell