KI-Modelle Leaderboard 2026
Alle relevanten Large Language Models auf einen Blick — sortiert nach Quality Index, Geschwindigkeit, Latenz und Preis. Datenquelle: Artificial Analysis.
Aktuell gefiltert auf Perplexity · 3 Modelle · Letzte Synchronisation:
Wie liest du dieses Leaderboard?
Quality Index ist ein zusammengesetzter Wert von Artificial Analysis aus über zehn unabhängigen Benchmarks (MMLU-Pro, GPQA, HLE, LiveCodeBench, SciCode, AIME u. a.). Höher = besser. Speed misst Output-Tokens pro Sekunde im Median über alle Hosting-Provider. Latency ist die Time-to-First-Token in Sekunden — wichtig für Streaming-UIs. Preise sind US-Dollar pro 1 Million Tokens, separat für Input und Output. Sortiere nach deiner Priorität, filter nach Anbieter oder Preis-Bucket — und prüfe konkrete Kosten direkt im Token-Rechner oder zwei Modelle im Head-to-Head-Vergleich.
| # | Modell | Vendor | Quality | Speed | Latency | Preis (USD/1M) |
|---|---|---|---|---|---|---|
| 1 |
Perplexity: Sonar Reasoning Pro
perplexity/sonar-reasoning-pro
|
Perplexity | 24,6 | 0 t/s | 0 ms |
$0 in
$0 out
|
| 2 |
Perplexity: Sonar
perplexity/sonar
|
Perplexity | 15,5 | 0 t/s | 0 ms |
$0 in
$0 out
|
| 3 |
Perplexity: Sonar Pro
perplexity/sonar-pro
|
Perplexity | 15,2 | 0 t/s | 0 ms |
$0 in
$0 out
|
Pricing-Calculator
Schätze deine monatlichen API-Kosten — gib dein erwartetes Token-Volumen ein, wir rechnen für die Top-15 Modelle.
| # | Modell | Vendor | Quality | Kosten/Monat (USD) |
|---|
Quality vs. Preis (Pareto-Chart)
Wo liegt der beste Tradeoff? Modelle oben-links sind die Pareto-Optima: hohe Quality, niedriger Preis.
❓ Häufige Fragen zum KI-Modelle-Leaderboard
Woher stammen die Leaderboard-Daten?
Was misst der Quality Index genau?
Warum sind manche bekannte Modelle nicht im Leaderboard?
is_active=true markiert sind und für die Artificial Analysis vollständige Benchmark-Daten liefert. Reine Bild- oder Audio-Modelle, deprecatete Versionen sowie Closed-Beta-Modelle ohne öffentliche API erscheinen nicht.