PromptLoop
News Analyse Werkstatt Generative Medien Originals Glossar KI-Modelle Vergleich Kosten-Rechner
📊 Live Benchmark

KI-Modelle Leaderboard 2026

Alle relevanten Large Language Models auf einen Blick — sortiert nach Quality Index, Geschwindigkeit, Latenz und Preis. Datenquelle: Artificial Analysis.

Aktuell gefiltert auf OpenAI · 34 Modelle · Letzte Synchronisation:

Wie liest du dieses Leaderboard?

Quality Index ist ein zusammengesetzter Wert von Artificial Analysis aus über zehn unabhängigen Benchmarks (MMLU-Pro, GPQA, HLE, LiveCodeBench, SciCode, AIME u. a.). Höher = besser. Speed misst Output-Tokens pro Sekunde im Median über alle Hosting-Provider. Latency ist die Time-to-First-Token in Sekunden — wichtig für Streaming-UIs. Preise sind US-Dollar pro 1 Million Tokens, separat für Input und Output. Sortiere nach deiner Priorität, filter nach Anbieter oder Preis-Bucket — und prüfe konkrete Kosten direkt im Token-Rechner oder zwei Modelle im Head-to-Head-Vergleich.

Modalität
# Modell Vendor Quality Speed Latency Preis (USD/1M)
1
OpenAI: GPT-5.5
openai/gpt-5.5
OpenAI 60,2 66,2 t/s 84,68 s
$5.00 in
$30.00 out
2
OpenAI: GPT-5.3-Codex
openai/gpt-5.3-codex
OpenAI 53,6 97,5 t/s 60,44 s
$1.75 in
$14.00 out
3
OpenAI: GPT-5.2-Codex
openai/gpt-5.2-codex
OpenAI 49 131,8 t/s 1,70 s
$1.75 in
$14.00 out
4
OpenAI: GPT-5.4 Mini
openai/gpt-5.4-mini
OpenAI 48,9 169,8 t/s 8,96 s
$0.75 in
$4.50 out
5
OpenAI: GPT-5.2
openai/gpt-5.2
OpenAI 46,6 0 t/s 0 ms
$1.75 in
$14.00 out
6
OpenAI: GPT-5 Codex
openai/gpt-5-codex
OpenAI 44,6 186,3 t/s 7,99 s
$1.25 in
$10.00 out
7
OpenAI: GPT-5.1-Codex
openai/gpt-5.1-codex
OpenAI 43,1 174,1 t/s 4,34 s
$1.25 in
$10.00 out
8
OpenAI: o3 Pro
openai/o3-pro
OpenAI 40,7 33,2 t/s 66,82 s
$20.00 in
$80.00 out
9
OpenAI: GPT-5
openai/gpt-5
OpenAI 39,2 72,5 t/s 11,36 s
$1.25 in
$10.00 out
10
OpenAI: GPT-5 Mini
openai/gpt-5-mini
OpenAI 38,9 88,6 t/s 19,07 s
$0.25 in
$2.00 out
11
OpenAI: GPT-5.1-Codex-Mini
openai/gpt-5.1-codex-mini
OpenAI 38,6 214,9 t/s 3,64 s
$0.25 in
$2.00 out
12
OpenAI: o3
openai/o3
OpenAI 38,4 140,4 t/s 7,34 s
$2.00 in
$8.00 out
13
OpenAI: GPT-5.4 Nano
openai/gpt-5.4-nano
OpenAI 38,1 165,1 t/s 3,84 s
$0.20 in
$1.25 out
14
OpenAI: o4 Mini
openai/o4-mini
OpenAI 33,1 176,0 t/s 19,07 s
$1.10 in
$4.40 out
15
OpenAI: o1
openai/o1
OpenAI 30,7 136,6 t/s 15,44 s
$15.00 in
$60.00 out
16
OpenAI: GPT-5.1
openai/gpt-5.1
OpenAI 27,4 136,5 t/s 717 ms
$1.25 in
$10.00 out
17
OpenAI: GPT-5 Nano
openai/gpt-5-nano
OpenAI 26,8 154,8 t/s 93,82 s
$0.05 in
$0.40 out
18
OpenAI: GPT-4.1
openai/gpt-4.1
OpenAI 26,3 149,7 t/s 583 ms
$2.00 in
$8.00 out
19
OpenAI: o3 Mini
openai/o3-mini
OpenAI 25,9 202,2 t/s 6,18 s
$1.10 in
$4.40 out
20
OpenAI: o1-pro
openai/o1-pro
OpenAI 25,8 0 t/s 0 ms
$150.00 in
$600.00 out
21
OpenAI: gpt-oss-120b
openai/gpt-oss-120b
OpenAI 24,5 373,5 t/s 494 ms
$0.15 in
$0.60 out
22
OpenAI: GPT-4.1 Mini
openai/gpt-4.1-mini
OpenAI 22,9 88,0 t/s 567 ms
$0.40 in
$1.60 out
23
OpenAI: gpt-oss-20b
openai/gpt-oss-20b
OpenAI 20,8 272,6 t/s 456 ms
$0.06 in
$0.20 out
24
OpenAI: GPT-5.4
openai/gpt-5.4
OpenAI 20 0 t/s 0 ms
$0 in
$0 out
25
OpenAI: GPT-4o (2024-08-06)
openai/gpt-4o-2024-08-06
OpenAI 18,6 135,3 t/s 632 ms
$2.50 in
$10.00 out
26
OpenAI: GPT-4o
openai/gpt-4o
OpenAI 17,3 136,1 t/s 482 ms
$2.50 in
$10.00 out
27
OpenAI: GPT-4o (2024-05-13)
openai/gpt-4o-2024-05-13
OpenAI 14,5 138,2 t/s 530 ms
$5.00 in
$15.00 out
28
OpenAI: GPT-4 Turbo
openai/gpt-4-turbo
OpenAI 13,7 33,8 t/s 1,47 s
$10.00 in
$30.00 out
29
OpenAI: GPT-4.1 Nano
openai/gpt-4.1-nano
OpenAI 13 189,8 t/s 408 ms
$0.10 in
$0.40 out
30
OpenAI: GPT-4
openai/gpt-4
OpenAI 12,8 45,9 t/s 987 ms
$30.00 in
$60.00 out
31
OpenAI: GPT-4o-mini
openai/gpt-4o-mini
OpenAI 12,6 70,5 t/s 478 ms
$0.15 in
$0.60 out
32
OpenAI: GPT Chat Latest
openai/gpt-chat-latest
OpenAI — t/s
in
out
33
OpenAI: GPT-5.4 Image 2
openai/gpt-5.4-image-2
OpenAI — t/s
in
out
34
OpenAI: o4 Mini High
openai/o4-mini-high
OpenAI — t/s
in
out
🧮 Tool

Pricing-Calculator

Schätze deine monatlichen API-Kosten — gib dein erwartetes Token-Volumen ein, wir rechnen für die Top-15 Modelle.

#ModellVendorQualityKosten/Monat (USD)
📈 Tool

Quality vs. Preis (Pareto-Chart)

Wo liegt der beste Tradeoff? Modelle oben-links sind die Pareto-Optima: hohe Quality, niedriger Preis.

Pareto-Optimum Andere Modelle

❓ Häufige Fragen zum KI-Modelle-Leaderboard

Woher stammen die Leaderboard-Daten?
Quality Index, Speed (Output-Tokens/s), Latenz (Time-to-First-Token) und Preise (USD pro 1 Mio. Tokens) kommen direkt von Artificial Analysis. Synchronisation täglich um 04:00 UTC. Wir speichern keine eigenen Benchmark-Werte und führen keine eigene Bewertung durch.
Was misst der Quality Index genau?
Der Artificial-Analysis-Intelligence-Index ist ein zusammengesetzter Score aus über zehn unabhängigen Benchmarks: MMLU-Pro (Wissen), GPQA & HLE (Reasoning), LiveCodeBench & SciCode (Coding), AIME (Mathematik), IFBench (Instruction-Following), LCR (Long-Context-Recall) und τ² (Tool-Use). Skala 0–100 — höher = besser.
Warum sind manche bekannte Modelle nicht im Leaderboard?
Wir zeigen nur Modelle, die in der Registry als is_active=true markiert sind und für die Artificial Analysis vollständige Benchmark-Daten liefert. Reine Bild- oder Audio-Modelle, deprecatete Versionen sowie Closed-Beta-Modelle ohne öffentliche API erscheinen nicht.
Wie nutze ich Sortierung und Filter sinnvoll?
Sortiere nach Quality für maximale Genauigkeit, nach Speed für hohen Durchsatz, nach Latency für reaktive Streaming-UIs und nach Preis für kostensensitive Workloads. Kombiniere die Vendor- und Preis-Filter, um z. B. „nur OpenAI unter 5 USD/Mio. Output“ zu finden.
Wie berechne ich konkrete Token-Kosten?
Im Token-Kostenrechner kannst du Input- und Output-Volumen einsetzen und die monatlichen Kosten für jedes Modell live durchspielen. Für direkten Head-to-Head-Vergleich zweier Modelle nutze die Vergleichs-Seiten.

Methodik. Der Quality Index ist der Artificial-Analysis-Intelligence-Index (kombiniertes Ranking aus MMLU-Pro, GPQA, HLE, LiveCodeBench, SciCode, AIME, IFBench, LCR und τ²). Speed und Latency sind Median-Werte über alle Provider, Preise pro 1 Mio Tokens (Input/Output). Synchronisation täglich um 04:00 UTC.

PromptLoop ist nicht mit Artificial Analysis verbunden. Alle Marken sind Eigentum ihrer jeweiligen Inhaber.

📬 KI-News direkt ins Postfach