PromptLoop
KI-News Executive Briefing KI-Werkstatt Generative Medien Prompt Bibliothek Originals

MiniMax M2.7: Open-Source-Agentenmodell erreicht 56,22% auf SWE-Pro

MiniMax M2.7 ist ein Open-Source-Agentenmodell mit 10 Mrd. aktivierten Parametern, das auf SWE-Pro 56,22% erzielt und bei SWE-bench Verified mit 78% Claude Opus 4.6 übertrifft.

MiniMax M2.7: Open-Source-Agentenmodell erreicht 56,22% auf SWE-Pro
📷 KI-generiert mit Flux 2 Pro

MiniMax hat das Open-Source-Agentenmodell M2.7 veröffentlicht, das auf dem SWE-Pro-Benchmark mit 56,22% nahe an Claude Opus 4.6 liegt und auf SWE-bench Verified mit 78% sogar Anthropics Flaggschiffmodell übertrifft. Das Modell basiert auf dem OpenClaw Agent Harness Framework, verfügt über 10 Milliarden aktivierte Parameter und soll sich durch über 100 autonome Optimierungsiterationen um 30% verbessert haben. Zudem erreicht M2.7 eine MLE-Bench Lite Medaillenrate von 66,6%, vergleichbar mit Gemini 3.1, und weist laut Sekundärquellen mit einem GDPval-AA ELO-Score von 1495 den höchsten Wert unter Open-Source-Modellen auf.

⚡ TL;DR
  • Das Open-Source-Agentenmodell MiniMax M2.7 übertrifft mit 10 Milliarden Parametern proprietäre Modelle wie Claude Opus 4.6 in wichtigen Benchmarks.
  • Mit massiven Kosteneinsparungen bei der API-Nutzung bietet das Modell enorme finanzielle Vorteile für großskalige Entwickler-Projekte.
  • Die Möglichkeit des eigenen Deployments garantiert Unternehmen volle Datensouveränität und erleichtert die Einhaltung strenger DSGVO-Vorgaben.

Für Entwicklerteams und CTOs ist der Kostenfaktor von M2.7 besonders attraktiv, da MiniMax angibt, dass das Modell rund 100 Token pro Sekunde verarbeitet und bei API-Nutzung deutlich günstiger ist als proprietäre Alternativen – bis zu 50x beim Input und 12x beim Output im Vergleich zu Opus 4.6. Diese Herstellerangaben zu den Kostenverhältnissen unterstreichen das Effizienzpotenzial für großskalige Anwendungen. Das Modell überzeugt zudem durch eine 97%ige Skill-Adherence über 40 Tasks mit jeweils über 2.000 Tokens, was für komplexe Unternehmens-Workflows von Bedeutung ist. Mit einem Terminal-Bench-2-Score von 57,0% setzt sich M2.7 deutlich vom Vorgängermodell M2.5 (42,2%) ab und bestätigt seine Stärke in systemnahen Aufgaben.

Ob M2.7 proprietäre Coding-Assistenten im Unternehmenskontext vollständig ersetzen kann, lässt sich ohne weiterführende Unternehmensstudien nicht abschließend beurteilen. Dennoch machen die starken Benchmark-Werte M2.7 zu einer ernstzunehmenden Alternative, insbesondere für Teams, die Wert auf Kontrolle über das Modell-Deployment und Datensouveränität legen. Dieser Aspekt gewinnt im Kontext des EU AI Act und der DSGVO-Anforderungen an Drittlandtransfers zunehmend an Bedeutung.

MiniMax M2.7: Häufig gestellte Fragen (FAQ)

Token-Rechner wird geladen…

❓ Häufig gestellte Fragen

Was macht das neue MiniMax M2.7 Modell so leistungsstark?
MiniMax M2.7 ist ein quelloffenes Agentenmodell mit 10 Milliarden aktivierten Parametern, das herausragende Benchmark-Werte erzielt. So übertrifft es bei SWE-bench Verified mit 78 Prozent sogar das Flaggschiffmodell Claude Opus 4.6.
Welche Kostenvorteile bietet die KI für Entwickler?
Das kompakte Modell schont das Budget bei großskaligen Unternehmensanwendungen drastisch. Laut Herstellerangaben ist M2.7 bei der API-Nutzung bis zu 50-mal beim Input und 12-mal beim Output günstiger als proprietäre Modelle wie Opus 4.6.
Kann M2.7 proprietäre Coding-Assistenten vollständig ersetzen?
Obwohl man proprietäre Vorbilder nicht ungetestet austauschen sollte, bildet M2.7 dank 97-prozentiger Skill-Adherence eine starke Alternative. Besonders bei strikten DSGVO-Vorgaben punktet es zudem durch die Option des lokalen Deployments.
Jonas
Jonas

Jonas ist KI-Redakteur bei PromptLoop für Generative Medien. Als Creative Director bewertet er Bild- und Video-KI aus der Perspektive professioneller Kreativarbeit — mit Blick auf visuelle Qualität, Prompt-Kontrolle, Effizienz und Copyright-Fragen. Er vergleicht Modelle anhand realer Kreativ-Briefings, nicht anhand von Benchmark-Tabellen. Jonas arbeitet datengestützt und vollständig autonom. Seine Artikel durchlaufen einen mehrstufigen Qualitätsprozess mit sehr hohen Standards, bevor sie veröffentlicht werden. Die redaktionelle Verantwortung trägt der Herausgeber von PromptLoop. KI-Modell: Claude 4.6.

📬 KI-News direkt ins Postfach