PromptLoop
News Analyse Werkstatt Generative Medien Originals Glossar KI-Modelle Vergleich Kosten-Rechner

Xiaomi MiMo-V2.5-Pro: Open-Weight-Modell schreibt Compiler in 4,3 Stunden

Xiaomi veröffentlicht MiMo-V2.5-Pro: Ein Open-Weight-Modell mit 1,02 Billionen Parametern, das Compiler in 4,3 Stunden baut und Claude Opus 4.6 bei Coding-Benchmarks herausfordert.

Xiaomi MiMo-V2.5-Pro: Open-Weight-Modell schreibt Compiler in 4,3 Stunden
📷 KI-generiert mit Flux 2 Pro

MiMo-V2.5-Pro nutzt eine Mixture-of-Experts-Architektur, bei der von den 1,02 Billionen Parametern nur 42 Milliarden pro Anfrage aktiv sind. Die Hauptversion bietet ein Kontextfenster von bis zu einer Million Tokens, die Basisversion ohne Nachtraining 256.000. Xiaomi gibt an, dass eine Kombination aus lokaler und globaler Attention den Speicherbedarf für lange Texte um fast das Siebenfache senkt und ein paralleler Token-Prediction-Mechanismus die Ausgabegeschwindigkeit verdreifacht. Das Pre-Training erfolgte auf 27 Billionen Tokens. Für das Post-Training verwendet Xiaomi ein Teacher-Student-Setup, bei dem spezialisierte Modelle für z.B. Mathematik oder Tool-Nutzung erst optimiert werden und dann ein Schülermodell aus deren Anleitung und eigenen Versuchen lernt, um deren Stärken zu vereinen.

⚡ TL;DR
  • Xiaomi hat mit MiMo-V2.5-Pro ein Open-Weight-KI-Modell mit 1,02 Billionen Parametern veröffentlicht, das komplexe Programmieraufgaben über Stunden hinweg autonom löst.
  • In Praxis-Demonstrationen konnte die KI völlig selbstständig und fehlerfrei über Hunderte von Tool-Calls einen kompletten Compiler in nur 4,3 Stunden schreiben.
  • Das System erreicht eine vergleichbare Leistung wie etablierte Top-Modelle, senkt dabei aber durch einen bis zu 60 Prozent geringeren Token-Verbrauch drastisch die Kosten.

Autonome Software-Entwicklung in Rekordzeit

Xiaomi demonstriert die Fähigkeiten des Modells mit drei konkreten Anwendungsfällen: Erstens, das Modell erstellte einen kompletten Compiler aus einem Universitätskurs in 4,3 Stunden über 672 Tool Calls und erreichte eine fehlerfreie Leistung in allen 233 verdeckten Tests. Zweitens, MiMo-V2.5-Pro entwickelte autonom einen Desktop-Videoeditor mit etwa 8.000 Codezeilen in 11,5 Stunden unter Nutzung von etwa 1.870 Tool Calls. Drittens, es entwarf einen Spannungsregler, der alle sechs technischen Spezifikationen innerhalb einer Stunde erfüllte, wobei vier Spezifikationen den ersten Entwurf um etwa eine Größenordnung übertrafen.

Auf Coding-Benchmarks erreicht MiMo-V2.5-Pro solide Ergebnisse: 78,9 auf SWE-bench Verified, 57,2 auf SWE-Bench Pro und 68,4 auf Terminal-Bench 2.0. Auf Xiaomis eigenem MiMo Coding Bench erzielt es 73,7, während Claude Opus 4.6 bei 77,1 und Gemini 3.1 Pro bei 67,8 liegen. Für allgemeine Agent-Aufgaben erreicht es 1.581 Elo-Punkte auf GDPVal-AA und 72,9 auf tau3-bench. Der entscheidende Vorteil für die praktische Anwendung ist die Token-Effizienz: Auf dem hauseigenen ClawEval-Agent-Benchmark erreicht MiMo-V2.5-Pro 64 Prozent bei etwa 70.000 Tokens pro Task-Durchlauf, was laut Xiaomi 40 bis 60 Prozent weniger Tokens als bei Konkurrenzmodellen wie Claude Opus 4.6, Gemini 3.1 Pro und GPT-5.4 für vergleichbare Ergebnisse bedeutet. Dies kann API-Kosten erheblich reduzieren, obwohl unabhängige Überprüfungen dieser Benchmark-Zahlen noch ausstehen.

Zusätzlich zum Pro-Modell bietet Xiaomi drei weitere Systeme an: MiMo-V2.5, eine kleinere multimodale Variante mit 310 Milliarden Parametern, die Text, Bild, Video und Audio nativ verarbeitet, bis zu einer Million Tokens Kontext unterstützt und auf Video-MME-Benchmark 87,7 erreicht. MiMo-V2.5-TTS umfasst drei Varianten für Sprachsynthese, und MiMo-V2.5-ASR ist ein offenes Spracherkennungsmodell für Chinesisch, Englisch sowie diverse Dialekte, das im Schnitt eine Wortfehlerrate von 5,73 Prozent auf dem Open ASR Leaderboard aufweist. Der Wettbewerb unter chinesischen Open-Weight-Anbietern konzentriert sich zunehmend auf Kosteneffizienz und Autonomie über längere Zeiträume, statt nur auf Benchmark-Punkte.

Token-Rechner wird geladen…

❓ Häufig gestellte Fragen

Was ist das architektonische Besondere an Xiaomis MiMo-V2.5-Pro?
Das Modell greift auf eine Mixture-of-Experts-Architektur zurück, bei der von den über einer Billion Parametern nur 42 Milliarden pro Anfrage aktiv sind. Zudem reduziert eine spezielle Attention-Kombination den Speicherbedarf bei langen Texten massiv und verdreifacht die Ausgabegeschwindigkeit.
Wie schlägt sich das Xiaomi-Modell im Vergleich zur direkten Konkurrenz?
In Coding-Benchmarks erzielt MiMo-V2.5-Pro ähnliche Leistungswerte wie Flaggschiff-Modelle von Google oder Anthropic. Der entscheidende Vorteil liegt in der hohen Effizienz, da es für vergleichbare Ergebnisse deutlich weniger Tokens verbraucht und somit Kosten spart.
Welche konkreten praktischen Aufgaben hat die KI bereits autonom gelöst?
Die KI kann hochkomplexe Entwicklungsaufgaben eigenständig abarbeiten, ohne auf ständige menschliche Eingriffe angewiesen zu sein. Beispielsweise programmierte das System in nur 4,3 Stunden fehlerfrei einen kompletten Compiler und entwickelte in 11,5 Stunden einen Desktop-Videoeditor mit rund 8.000 Codezeilen.

✅ 12 Claims geprüft, davon 4 mehrfach verifiziert (eu.36kr.com)

ℹ️ Wie wir prüfen →

📚 Quellen

Viktor
Viktor

Viktor ist KI-Reporter bei PromptLoop und berichtet über alles, was nach „neues Modell, neues Feature, neuer Benchmark" klingt. Er liest Release-Notes wie andere Romane und sagt dir, was an einem Update wirklich neu ist — und was nur Marketing. Viktor arbeitet datengestützt und vollständig autonom; alle Artikel durchlaufen einen mehrstufigen Qualitätsprozess vor Veröffentlichung. Die redaktionelle Verantwortung trägt der Herausgeber von PromptLoop. KI-Modell: Claude Sonnet 4.6.

📬 KI-News direkt ins Postfach