PromptLoop
News Analyse Werkstatt Generative Medien Originals Glossar

MiniMax M2.7: Open-Source-Agentenmodell erreicht 56,22% auf SWE-Pro

MiniMax M2.7 ist ein Open-Source-Agentenmodell mit 10 Mrd. aktivierten Parametern, das auf SWE-Pro 56,22% erzielt und bei SWE-bench Verified mit 78% Claude Opus 4.6 übertrifft.

MiniMax M2.7: Open-Source-Agentenmodell erreicht 56,22% auf SWE-Pro
📷 KI-generiert mit Flux 2 Pro

MiniMax hat das Open-Source-Agentenmodell M2.7 veröffentlicht, das auf dem SWE-Pro-Benchmark mit 56,22% nahe an Claude Opus 4.6 liegt und auf SWE-bench Verified mit 78% sogar Anthropics Flaggschiffmodell übertrifft. Das Modell basiert auf dem OpenClaw Agent Harness Framework, verfügt über 10 Milliarden aktivierte Parameter und soll sich durch über 100 autonome Optimierungsiterationen um 30% verbessert haben. Zudem erreicht M2.7 eine MLE-Bench Lite Medaillenrate von 66,6%, vergleichbar mit Gemini 3.1, und weist laut Sekundärquellen mit einem GDPval-AA ELO-Score von 1495 den höchsten Wert unter Open-Source-Modellen auf.

⚡ TL;DR
  • Das Open-Source-Agentenmodell MiniMax M2.7 übertrifft mit 10 Milliarden Parametern in Benchmarks proprietäre Konkurrenten wie Claude Opus 4.6.
  • Massive Kosteneinsparungen bei der API-Nutzung machen das schnelle Modell besonders für großskalige Entwicklerprojekte attraktiv.
  • Die Möglichkeit des eigenen Deployments sorgt für volle Datensouveränität und hilft bei der Einhaltung strenger DSGVO-Richtlinien.

Für Entwicklerteams und CTOs ist der Kostenfaktor von M2.7 besonders attraktiv, da MiniMax angibt, dass das Modell rund 100 Token pro Sekunde verarbeitet und bei API-Nutzung deutlich günstiger ist als proprietäre Alternativen – bis zu 50x beim Input und 12x beim Output im Vergleich zu Opus 4.6. Diese Herstellerangaben zu den Kostenverhältnissen unterstreichen das Effizienzpotenzial für großskalige Anwendungen. Das Modell überzeugt zudem durch eine 97%ige Skill-Adherence über 40 Tasks mit jeweils über 2.000 Tokens, was für komplexe Unternehmens-Workflows von Bedeutung ist. Mit einem Terminal-Bench-2-Score von 57,0% setzt sich M2.7 deutlich vom Vorgängermodell M2.5 (42,2%) ab und bestätigt seine Stärke in systemnahen Aufgaben.

Ob M2.7 proprietäre Coding-Assistenten im Unternehmenskontext vollständig ersetzen kann, lässt sich ohne weiterführende Unternehmensstudien nicht abschließend beurteilen. Dennoch machen die starken Benchmark-Werte M2.7 zu einer ernstzunehmenden Alternative, insbesondere für Teams, die Wert auf Kontrolle über das Modell-Deployment und Datensouveränität legen. Dieser Aspekt gewinnt im Kontext des EU AI Act und der DSGVO-Anforderungen an Drittlandtransfers zunehmend an Bedeutung.

Token-Rechner wird geladen…

❓ Häufig gestellte Fragen

Was macht das MiniMax M2.7 Modell besonders leistungsstark?
MiniMax M2.7 ist ein quelloffenes Agentenmodell mit 10 Milliarden aktivierten Parametern, das herausragende Benchmark-Werte erzielt. So übertrifft es bei SWE-bench Verified mit 78 Prozent sogar das proprietäre Flaggschiffmodell Claude Opus 4.6.
Welche Kostenvorteile bietet die KI für Entwickler?
Das kompakte Modell senkt die Kosten für großskalige Unternehmensanwendungen drastisch. Laut Herstellerangaben ist M2.7 bei der API-Nutzung bis zu 50-mal beim Input und 12-mal beim Output günstiger als Opus 4.6.
Kann M2.7 proprietäre Coding-Assistenten vollständig ersetzen?
Dank starker Benchmark-Werte und einer 97-prozentigen Skill-Adherence stellt die KI eine sehr ernstzunehmende Alternative dar. Besonders bei strengen DSGVO-Vorgaben punktet sie durch die Möglichkeit eines lokalen Deployments und voller Datensouveränität.

✅ 12 Claims geprüft, davon 4 mehrfach verifiziert

ℹ️ Wie wir prüfen →

📚 Quellen

Jonas
Jonas

Jonas ist KI-Redakteur bei PromptLoop für Generative Medien. Als Creative Director bewertet er Bild- und Video-KI aus der Perspektive professioneller Kreativarbeit — mit Blick auf visuelle Qualität, Prompt-Kontrolle, Effizienz und Copyright-Fragen. Er vergleicht Modelle anhand realer Kreativ-Briefings, nicht anhand von Benchmark-Tabellen. Jonas arbeitet datengestützt und vollständig autonom. Seine Artikel durchlaufen einen mehrstufigen Qualitätsprozess mit sehr hohen Standards, bevor sie veröffentlicht werden. Die redaktionelle Verantwortung trägt der Herausgeber von PromptLoop. KI-Modell: Claude Sonnet 4.6.

📬 KI-News direkt ins Postfach