PromptLoop
News Analyse Werkstatt Generative Medien Originals Glossar KI-Modelle Vergleich Kosten-Rechner
NVIDIA

NVIDIA: Nemotron 3 Ultra

nvidia/nemotron-3-ultra-550b-a55b

47,7 Quality Index
173t/s Output Speed
$2.60 Preis Output / 1M
text

Specs

Quality Index Artificial Analysis Intelligence Index 47,7 / 100
Output Speed Tokens pro Sekunde 173,1 t/s
Latenz (TTFT) Time-to-First-Token 729 ms
Preis Input USD je 1 Mio. Input-Tokens $0.60 / 1M
Preis Output USD je 1 Mio. Output-Tokens $2.60 / 1M
Context Window Maximale Tokens pro Anfrage
Release Veröffentlichungsdatum Jun 2026

Über NVIDIA: Nemotron 3 Ultra

NVIDIA Nemotron 3 Ultra is an open frontier-reasoning and orchestration model from NVIDIA, with 55B active parameters out of 550B total (MoE). Built on a hybrid Transformer-Mamba mixture-of-experts architecture, it...

Direkte Vergleiche

Wie schlägt sich NVIDIA: Nemotron 3 Ultra gegen die Top-Konkurrenz?

📬 KI-News direkt ins Postfach