KI-Modelle Leaderboard 2026
Alle relevanten Large Language Models auf einen Blick — sortiert nach Quality Index, Geschwindigkeit, Latenz und Preis. Datenquelle: Artificial Analysis.
Aktuell gefiltert auf DeepSeek · 9 Modelle · Letzte Synchronisation:
Wie liest du dieses Leaderboard?
Quality Index ist ein zusammengesetzter Wert von Artificial Analysis aus über zehn unabhängigen Benchmarks (MMLU-Pro, GPQA, HLE, LiveCodeBench, SciCode, AIME u. a.). Höher = besser. Speed misst Output-Tokens pro Sekunde im Median über alle Hosting-Provider. Latency ist die Time-to-First-Token in Sekunden — wichtig für Streaming-UIs. Preise sind US-Dollar pro 1 Million Tokens, separat für Input und Output. Sortiere nach deiner Priorität, filter nach Anbieter oder Preis-Bucket — und prüfe konkrete Kosten direkt im Token-Rechner oder zwei Modelle im Head-to-Head-Vergleich.
| # | Modell | Vendor | Quality | Speed | Latency | Preis (USD/1M) |
|---|---|---|---|---|---|---|
| 1 |
DeepSeek: DeepSeek V3.2
deepseek/deepseek-v3.2
|
DeepSeek | 41,7 | 0 t/s | 0 ms |
$0.30 in
$0.45 out
|
| 2 |
DeepSeek: DeepSeek V4 Pro
deepseek/deepseek-v4-pro
|
DeepSeek | 39,3 | 65,4 t/s | 1,22 s |
$0.435 in
$0.87 out
|
| 3 |
DeepSeek: DeepSeek V4 Flash
deepseek/deepseek-v4-flash
|
DeepSeek | 36,5 | 107,1 t/s | 1,01 s |
$0.14 in
$0.28 out
|
| 4 |
DeepSeek: DeepSeek V3.2 Speciale
deepseek/deepseek-v3.2-speciale
|
DeepSeek | 29,4 | 0 t/s | 0 ms |
$0 in
$0 out
|
| 5 |
DeepSeek: DeepSeek V3.1 Terminus
deepseek/deepseek-v3.1-terminus
|
DeepSeek | 28,5 | 0 t/s | 0 ms |
$0.27 in
$1.00 out
|
| 6 |
DeepSeek: R1
deepseek/deepseek-r1
|
DeepSeek | 27,1 | 0 t/s | 0 ms |
$1.35 in
$4.20 out
|
| 7 |
DeepSeek: R1 Distill Qwen 32B
deepseek/deepseek-r1-distill-qwen-32b
|
DeepSeek | 17,2 | 0 t/s | 0 ms |
$0 in
$0 out
|
| 8 |
DeepSeek: R1 Distill Llama 70B
deepseek/deepseek-r1-distill-llama-70b
|
DeepSeek | 16 | 44,9 t/s | 371 ms |
$0.70 in
$1.05 out
|
| 9 |
DeepSeek: DeepSeek V4 Flash (free)
deepseek/deepseek-v4-flash:free
|
DeepSeek | — | — t/s | — |
— in
— out
|
Pricing-Calculator
Schätze deine monatlichen API-Kosten — gib dein erwartetes Token-Volumen ein, wir rechnen für die Top-15 Modelle.
| # | Modell | Vendor | Quality | Kosten/Monat (USD) |
|---|
Quality vs. Preis (Pareto-Chart)
Wo liegt der beste Tradeoff? Modelle oben-links sind die Pareto-Optima: hohe Quality, niedriger Preis.
❓ Häufige Fragen zum KI-Modelle-Leaderboard
Woher stammen die Leaderboard-Daten?
Was misst der Quality Index genau?
Warum sind manche bekannte Modelle nicht im Leaderboard?
is_active=true markiert sind und für die Artificial Analysis vollständige Benchmark-Daten liefert. Reine Bild- oder Audio-Modelle, deprecatete Versionen sowie Closed-Beta-Modelle ohne öffentliche API erscheinen nicht.