📊 Live Benchmark

KI-Modelle Leaderboard 2026

Alle relevanten Large Language Models auf einen Blick — sortiert nach Quality Index, Geschwindigkeit, Latenz und Preis. Datenquelle: Artificial Analysis.

Aktuell gefiltert auf OpenAI · 38 Modelle · Letzte Synchronisation: 24. Juli 2026

Wie liest du dieses Leaderboard?

Quality Index ist ein zusammengesetzter Wert von Artificial Analysis aus über zehn unabhängigen Benchmarks (MMLU-Pro, GPQA, HLE, LiveCodeBench, SciCode, AIME u. a.). Höher = besser. Speed misst Output-Tokens pro Sekunde im Median über alle Hosting-Provider. Latency ist die Time-to-First-Token in Sekunden — wichtig für Streaming-UIs. Preise sind US-Dollar pro 1 Million Tokens, separat für Input und Output. Sortiere nach deiner Priorität, filter nach Anbieter oder Preis-Bucket — und prüfe konkrete Kosten direkt im Token-Rechner oder zwei Modelle im Head-to-Head-Vergleich.

#	Modell	Vendor	Quality	Speed	Latency	Preis (USD/1M)
1	OpenAI: GPT-5.6 Sol openai/gpt-5.6-sol	OpenAI	57,7	60,5 t/s	31,00 s	$5.00 in $30.00 out
2	OpenAI: GPT-5.5 openai/gpt-5.5	OpenAI	50,4	78,1 t/s	7,12 s	$5.00 in $30.00 out
3	OpenAI: GPT-5.6 Luna openai/gpt-5.6-luna	OpenAI	46,1	176,9 t/s	5,77 s	$1.00 in $6.00 out
4	OpenAI: GPT-5.3-Codex openai/gpt-5.3-codex	OpenAI	44,3	124,1 t/s	52,81 s	$1.75 in $14.00 out
5	OpenAI: GPT-5.2 openai/gpt-5.2	OpenAI	42,2	78,0 t/s	125,29 s	$1.75 in $14.00 out
6	OpenAI: GPT-5.6 Terra openai/gpt-5.6-terra	OpenAI	40,5	105,9 t/s	1,49 s	$2.50 in $15.00 out
7	OpenAI: GPT-5.2-Codex openai/gpt-5.2-codex	OpenAI	40,1	148,4 t/s	7,88 s	$1.75 in $14.00 out
8	OpenAI: GPT-5.1 openai/gpt-5.1	OpenAI	36,9	119,2 t/s	40,40 s	$1.25 in $10.00 out
9	OpenAI: GPT-5 Codex openai/gpt-5-codex	OpenAI	36,1	180,4 t/s	8,14 s	$1.25 in $10.00 out
10	OpenAI: GPT-5.1-Codex openai/gpt-5.1-codex	OpenAI	34,7	223,6 t/s	3,53 s	$1.25 in $10.00 out
11	OpenAI: GPT-5 openai/gpt-5	OpenAI	34,7	116,7 t/s	150,51 s	$1.25 in $10.00 out
12	OpenAI: o3 Pro openai/o3-pro	OpenAI	32,5	0 t/s	0 ms	$20.00 in $80.00 out
13	OpenAI: GPT-5 Mini openai/gpt-5-mini	OpenAI	30,9	80,7 t/s	22,04 s	$0.25 in $2.00 out
14	OpenAI: GPT-5.1-Codex-Mini openai/gpt-5.1-codex-mini	OpenAI	30,6	205,2 t/s	3,42 s	$0.25 in $2.00 out
15	OpenAI: o3 openai/o3	OpenAI	30,4	127,7 t/s	7,98 s	$2.00 in $8.00 out
16	OpenAI: GPT-5.4 Nano openai/gpt-5.4-nano	OpenAI	30,2	127,9 t/s	5,10 s	$0.20 in $1.25 out
17	OpenAI: GPT-5.4 Mini openai/gpt-5.4-mini	OpenAI	29,8	187,2 t/s	13,36 s	$0.75 in $4.50 out
18	OpenAI: GPT-5.4 openai/gpt-5.4	OpenAI	27,7	103,4 t/s	706 ms	$2.50 in $15.00 out
19	OpenAI: o4 Mini openai/o4-mini	OpenAI	25,6	116,6 t/s	18,78 s	$1.10 in $4.40 out
20	OpenAI: o1 openai/o1	OpenAI	23,4	0 t/s	0 ms	$15.00 in $60.00 out
21	OpenAI: GPT-5 Nano openai/gpt-5-nano	OpenAI	19,9	164,1 t/s	71,97 s	$0.05 in $0.40 out
22	OpenAI: GPT-4.1 openai/gpt-4.1	OpenAI	19,4	155,9 t/s	1,01 s	$2.00 in $8.00 out
23	OpenAI: o3 Mini openai/o3-mini	OpenAI	19	198,4 t/s	6,10 s	$1.10 in $4.40 out
24	OpenAI: o1-pro openai/o1-pro	OpenAI	18,9	0 t/s	0 ms	$150.00 in $600.00 out
25	OpenAI: gpt-oss-120b openai/gpt-oss-120b	OpenAI	14,9	317,9 t/s	578 ms	$0.15 in $0.60 out
26	OpenAI: GPT-4.1 Mini openai/gpt-4.1-mini	OpenAI	14,8	87,7 t/s	505 ms	$0.40 in $1.60 out
27	OpenAI: gpt-oss-20b openai/gpt-oss-20b	OpenAI	14,3	249,7 t/s	463 ms	$0.07 in $0.20 out
28	OpenAI: GPT-4o openai/gpt-4o	OpenAI	11,2	161,9 t/s	527 ms	$2.50 in $10.00 out
29	OpenAI: GPT-4.1 Nano openai/gpt-4.1-nano	OpenAI	9,6	153,7 t/s	442 ms	$0.10 in $0.40 out
30	OpenAI: GPT-4o (2024-08-06) openai/gpt-4o-2024-08-06	OpenAI	9,6	75,3 t/s	1,17 s	$2.50 in $10.00 out
31	OpenAI: GPT-4o (2024-05-13) openai/gpt-4o-2024-05-13	OpenAI	8,6	94,5 t/s	471 ms	$5.00 in $15.00 out
32	OpenAI: GPT-4 Turbo openai/gpt-4-turbo	OpenAI	7,9	36,1 t/s	1,25 s	$10.00 in $30.00 out
33	OpenAI: GPT-4 openai/gpt-4	OpenAI	7	43,5 t/s	759 ms	$30.00 in $60.00 out
34	OpenAI: GPT-4o-mini openai/gpt-4o-mini	OpenAI	6,9	68,3 t/s	545 ms	$0.15 in $0.60 out
35	OpenAI: GPT-5.6 Luna Pro openai/gpt-5.6-luna-pro	OpenAI	—	— t/s	—	— in — out
36	OpenAI: GPT-5.6 Terra Pro openai/gpt-5.6-terra-pro	OpenAI	—	— t/s	—	— in — out
37	OpenAI: GPT-5.6 Sol Pro openai/gpt-5.6-sol-pro	OpenAI	—	— t/s	—	— in — out
38	OpenAI: GPT Chat Latest openai/gpt-chat-latest	OpenAI	—	— t/s	—	— in — out

🧮 Tool

Pricing-Calculator

Schätze deine monatlichen API-Kosten — gib dein erwartetes Token-Volumen ein, wir rechnen für die Top-15 Modelle.

Input Tokens (Mio./Monat) Output Tokens (Mio./Monat)

#	Modell	Vendor	Quality	Kosten/Monat (USD)

📈 Tool

Quality vs. Preis (Pareto-Chart)

Wo liegt der beste Tradeoff? Modelle oben-links sind die Pareto-Optima: hohe Quality, niedriger Preis.

Pareto-Optimum Andere Modelle

❓ Häufige Fragen zum KI-Modelle-Leaderboard

Woher stammen die Leaderboard-Daten?

Quality Index, Speed (Output-Tokens/s), Latenz (Time-to-First-Token) und Preise (USD pro 1 Mio. Tokens) kommen direkt von Artificial Analysis. Synchronisation täglich um 04:00 UTC. Wir speichern keine eigenen Benchmark-Werte und führen keine eigene Bewertung durch.

Was misst der Quality Index genau?

Der Artificial-Analysis-Intelligence-Index ist ein zusammengesetzter Score aus über zehn unabhängigen Benchmarks: MMLU-Pro (Wissen), GPQA & HLE (Reasoning), LiveCodeBench & SciCode (Coding), AIME (Mathematik), IFBench (Instruction-Following), LCR (Long-Context-Recall) und τ² (Tool-Use). Skala 0–100 — höher = besser.

Warum sind manche bekannte Modelle nicht im Leaderboard?

Wir zeigen nur Modelle, die in der Registry als is_active=true markiert sind und für die Artificial Analysis vollständige Benchmark-Daten liefert. Reine Bild- oder Audio-Modelle, deprecatete Versionen sowie Closed-Beta-Modelle ohne öffentliche API erscheinen nicht.

Wie nutze ich Sortierung und Filter sinnvoll?

Sortiere nach Quality für maximale Genauigkeit, nach Speed für hohen Durchsatz, nach Latency für reaktive Streaming-UIs und nach Preis für kostensensitive Workloads. Kombiniere die Vendor- und Preis-Filter, um z. B. „nur OpenAI unter 5 USD/Mio. Output“ zu finden.

Wie berechne ich konkrete Token-Kosten?

Im Token-Kostenrechner kannst du Input- und Output-Volumen einsetzen und die monatlichen Kosten für jedes Modell live durchspielen. Für direkten Head-to-Head-Vergleich zweier Modelle nutze die Vergleichs-Seiten.