KI-Modelle Leaderboard 2026
Alle relevanten Large Language Models auf einen Blick — sortiert nach Quality Index, Geschwindigkeit, Latenz und Preis. Datenquelle: Artificial Analysis.
Aktuell gefiltert auf Mistral · 9 Modelle · Letzte Synchronisation:
Wie liest du dieses Leaderboard?
Quality Index ist ein zusammengesetzter Wert von Artificial Analysis aus über zehn unabhängigen Benchmarks (MMLU-Pro, GPQA, HLE, LiveCodeBench, SciCode, AIME u. a.). Höher = besser. Speed misst Output-Tokens pro Sekunde im Median über alle Hosting-Provider. Latency ist die Time-to-First-Token in Sekunden — wichtig für Streaming-UIs. Preise sind US-Dollar pro 1 Million Tokens, separat für Input und Output. Sortiere nach deiner Priorität, filter nach Anbieter oder Preis-Bucket — und prüfe konkrete Kosten direkt im Token-Rechner oder zwei Modelle im Head-to-Head-Vergleich.
| # | Modell | Vendor | Quality | Speed | Latency | Preis (USD/1M) |
|---|---|---|---|---|---|---|
| 1 |
Mistral: Mistral Medium 3.5
mistralai/mistral-medium-3-5
|
Mistral | 39,2 | 63,9 t/s | 594 ms |
$1.50 in
$7.50 out
|
| 2 |
Mistral: Mistral Medium 3.1
mistralai/mistral-medium-3.1
|
Mistral | 21,3 | 89,5 t/s | 514 ms |
$0.40 in
$2.00 out
|
| 3 |
Mistral: Mistral Medium 3
mistralai/mistral-medium-3
|
Mistral | 18,8 | 46,8 t/s | 536 ms |
$0.40 in
$2.00 out
|
| 4 |
Mistral: Devstral Small 1.1
mistralai/devstral-small
|
Mistral | 15,2 | 51,3 t/s | 570 ms |
$0.10 in
$0.30 out
|
| 5 |
Mistral: Pixtral Large 2411
mistralai/pixtral-large-2411
|
Mistral | 14 | 60,3 t/s | 734 ms |
$2.00 in
$6.00 out
|
| 6 |
Mistral Large 2407
mistralai/mistral-large-2407
|
Mistral | 13 | 0 t/s | 0 ms |
$2.00 in
$6.00 out
|
| 7 |
Mistral: Saba
mistralai/mistral-saba
|
Mistral | 12,1 | 0 t/s | 0 ms |
$0 in
$0 out
|
| 8 |
Mistral Large
mistralai/mistral-large
|
Mistral | 9,9 | 0 t/s | 0 ms |
$4.00 in
$12.00 out
|
| 9 |
Mistral: Mixtral 8x7B Instruct
mistralai/mixtral-8x7b-instruct
|
Mistral | 7,7 | 0 t/s | 0 ms |
$0.45 in
$0.70 out
|
Pricing-Calculator
Schätze deine monatlichen API-Kosten — gib dein erwartetes Token-Volumen ein, wir rechnen für die Top-15 Modelle.
| # | Modell | Vendor | Quality | Kosten/Monat (USD) |
|---|
Quality vs. Preis (Pareto-Chart)
Wo liegt der beste Tradeoff? Modelle oben-links sind die Pareto-Optima: hohe Quality, niedriger Preis.
❓ Häufige Fragen zum KI-Modelle-Leaderboard
Woher stammen die Leaderboard-Daten?
Was misst der Quality Index genau?
Warum sind manche bekannte Modelle nicht im Leaderboard?
is_active=true markiert sind und für die Artificial Analysis vollständige Benchmark-Daten liefert. Reine Bild- oder Audio-Modelle, deprecatete Versionen sowie Closed-Beta-Modelle ohne öffentliche API erscheinen nicht.