PromptLoop
News Analyse Werkstatt Generative Medien Originals Glossar KI-Modelle Vergleich Kosten-Rechner

KI-Anbieter-Hub

Die GPU-Schmiede hinter dem KI-Boom

NVIDIA ist mit einem Marktanteil von über 80% bei KI-Beschleunigern der wichtigste Hardware-Lieferant der gesamten Branche. Neben den H100/H200/B200-GPUs wird zunehmend in eigene Modelle (Nemotron) und Software-Stacks (CUDA, NeMo, NIM) investiert. Marktkapitalisierung über 3 Bio. USD.

15aktive Modelle
47,7Top-Quality (NVIDIA: Nemotron 3 Ultra)
20News & Analysen
4Glossar-Begriffe
Hauptsitz
Santa Clara, USA
Gegründet
1993
CEO
Jensen Huang
Mitarbeiter
~32.000
Bewertung
~3.300 Mrd. USD (2025)
Investoren
Börsennotiert (NASDAQ: NVDA)
X / Twitter
@nvidia

NVIDIA im Porträt

Wer steckt hinter NVIDIA, was macht das Unternehmen einzigartig — und welche Rolle spielt es im globalen KI-Wettbewerb?

NVIDIA ist die unangefochtene Hardware-Schmiede des KI-Booms: Praktisch jedes große Sprachmodell der Welt wird auf NVIDIA-GPUs trainiert. Die Hopper-Generation (H100/H200) ist seit 2023 De-facto-Standard, die 2024 vorgestellte Blackwell-Architektur (B100/B200, GB200 NVL72) treibt das Tempo bei Reasoning-Modellen wie DeepSeek V4 weiter an. Über die CUDA-Plattform, das NeMo-Trainingsframework und die NIM-Microservices kontrolliert NVIDIA nicht nur die Chips, sondern auch den darüber liegenden Software-Stack — ein „Vendor Lock-in"-Vorsprung, der das Unternehmen zur teuersten börsennotierten Firma der Welt gemacht hat (rund 3,3 Billionen US-Dollar Marktkapitalisierung).

Schlüsselprodukte

  • H100 / H200
  • Blackwell B100/B200
  • GB200 NVL72
  • CUDA
  • NeMo
  • NIM Microservices
  • Omniverse

NVIDIA-Modelle im Vergleich (15)

Sortiert nach Quality-Index. Die Top-5 sind direkt sichtbar — alle weiteren 10 Modelle per Klick. Daten via Artificial Analysis, täglich synchronisiert.

#Modell QualitySpeed LatencyInput $/M Output $/MContext
1 NVIDIA: Nemotron 3 Ultra
nvidia/nemotron-3-ultra-550b-a55b
47,7 168,0 t/s 815 ms $0.675 $2.675
2 NVIDIA: Nemotron 3 Super
nvidia/nemotron-3-super-120b-a12b
36 182,5 t/s 996 ms $0.30 $0.75
3 NVIDIA: Llama 3.1 Nemotron Ultra 253B v1
nvidia/llama-3.1-nemotron-ultra-253b-v1
15 51,4 t/s 740 ms $0.60 $1.80
4 NVIDIA: Nemotron Nano 9B V2
nvidia/nemotron-nano-9b-v2
14,8 114,3 t/s 287 ms $0.04 $0.16
5 NVIDIA: Llama 3.1 Nemotron 70B Instruct
nvidia/llama-3.1-nemotron-70b-instruct
13,4 305,9 t/s 3,96 s $1.20 $1.20
Alle 15 Modelle anzeigen ↓Weniger anzeigen ↑
#Modell QualitySpeed LatencyInput $/M Output $/MContext
6 NVIDIA: Nemotron 3 Nano 30B A3B
nvidia/nemotron-3-nano-30b-a3b
13,2 55,6 t/s 292 ms $0.05 $0.20
7 NVIDIA: Nemotron Nano 12B 2 VL
nvidia/nemotron-nano-12b-v2-vl
10,1 218,1 t/s 702 ms $0.20 $0.60
8 NVIDIA: Nemotron 3.5 Content Safety (free)
nvidia/nemotron-3.5-content-safety:free
— t/s
9 NVIDIA: Nemotron 3 Ultra (free)
nvidia/nemotron-3-ultra-550b-a55b:free
— t/s
10 NVIDIA: Nemotron 3 Nano Omni (free)
nvidia/nemotron-3-nano-omni-30b-a3b-reasoning:free
— t/s
11 NVIDIA: Nemotron 3 Super (free)
nvidia/nemotron-3-super-120b-a12b:free
— t/s
12 NVIDIA: Nemotron 3 Nano 30B A3B (free)
nvidia/nemotron-3-nano-30b-a3b:free
— t/s
13 NVIDIA: Nemotron Nano 12B 2 VL (free)
nvidia/nemotron-nano-12b-v2-vl:free
— t/s
14 NVIDIA: Llama 3.3 Nemotron Super 49B V1.5
nvidia/llama-3.3-nemotron-super-49b-v1.5
— t/s
15 NVIDIA: Nemotron Nano 9B V2 (free)
nvidia/nemotron-nano-9b-v2:free
— t/s

→ Vollständiges Leaderboard mit allen Anbietern

Release-Timeline

Chronologie der jüngsten Modell-Releases von NVIDIA.

  1. NVIDIA: Nemotron 3.5 Content Safety (free)
  2. NVIDIA: Nemotron 3 Ultra (free)
  3. NVIDIA: Nemotron 3 Ultra Quality 47,7
  4. NVIDIA: Nemotron 3 Nano Omni (free)
  5. NVIDIA: Nemotron 3 Super (free)
  6. NVIDIA: Nemotron 3 Super Quality 36
  7. NVIDIA: Nemotron 3 Nano 30B A3B Quality 13,2
  8. NVIDIA: Nemotron 3 Nano 30B A3B (free)
  9. NVIDIA: Nemotron Nano 12B 2 VL (free)
  10. NVIDIA: Nemotron Nano 12B 2 VL Quality 10,1
  11. NVIDIA: Llama 3.3 Nemotron Super 49B V1.5
  12. NVIDIA: Nemotron Nano 9B V2 (free)
  13. NVIDIA: Nemotron Nano 9B V2 Quality 14,8
  14. NVIDIA: Llama 3.1 Nemotron Ultra 253B v1 Quality 15
  15. NVIDIA: Llama 3.1 Nemotron 70B Instruct Quality 13,4

Glossar zu NVIDIA

Begriffe und Produkte aus dem NVIDIA-Universum, von der Redaktion erklärt.

Direkte Modell-Vergleiche

Head-to-Head: NVIDIA-Modelle vs. die Top-Konkurrenz.

NVIDIA im Wettbewerb

Wie sich NVIDIA gegen andere große KI-Anbieter positioniert.

Weitere KI-Anbieter

Wie diese Seite gepflegt wird

Der NVIDIA-Hub bündelt alles, was unsere Redaktion zum Anbieter weiß: Stammdaten und Profil pflegen wir manuell und prüfen sie regelmäßig auf Aktualität. Die Modell-Performance in der Tabelle wird täglich um 04:00 UTC aus dem unabhängigen Benchmark Artificial Analysis synchronisiert — neue Releases erscheinen automatisch innerhalb von 24 Stunden, sobald dort Messdaten vorliegen. Glossar-Begriffe sind redaktionell gepflegt und nach EU-AI-Act dokumentiert. Die Vergleichsseiten entstehen automatisch aus den Top-Modell-Paarungen. Wenn du einen Fehler findest oder einen neuen Vergleich vermisst, schreib uns — wir reagieren in der Regel innerhalb eines Werktags.

Vollständiges Leaderboard · Modell-Vergleiche · KI-Glossar · Alle Anbieter

Letzte News & Analysen zu NVIDIA

20 Artikel aus unserer Redaktion — von Produkt-Launches über strategische Einordnungen bis hin zu kritischen Analysen. Chronologisch absteigend, der jüngste Beitrag zuerst.

Nvidia H200: USA genehmigen China-Verkäufe an 10 Firmen — Peking blockiert trotzdem

Das US-Handelsministerium hat 10 chinesischen Firmen wie Alibaba und ByteDance den H200-Kauf erlaubt — geliefert wurde bislang kein einziger Chip.

NVIDIA Dynamo: Effizientere Agenten-Inferenz durch erweiterte Cache-Steuerung

NVIDIA Dynamo optimiert die Inferenz für KI-Agenten, indem es Engpässe bei der KV-Cache-Nutzung adressiert. Neue APIs verbessern die Kommunikation zwischen Agen…

NVIDIA Dynamo: KV‑aware Inferenz entsperrt skalierende Coding‑Agenten

Agentische Coding‑Workloads explodieren – der Inferenz‑Stack wird zum Engpass. NVIDIA Dynamo optimiert Frontend, Routing und KV‑Cache für geringere Latenz und K…

Nvidia-Report 2026: 70% nutzen KI, 85% Umsatzplus – ROI kommt aus vier Bereichen

Nvidia meldet 70% KI-Adoption im Healthcare. 85% der Executives sehen Umsatzplus, 80% Kostensenkung. Der ROI konzentriert sich auf Bildgebung, Drug Discovery, A…

Apple Silicon: Tiny Corp bringt Nvidia- und AMD-eGPUs für KI-Workloads auf den Mac

Tiny Corp hat Treiber entwickelt, die Nvidia RTX- und AMD RDNA3+-GPUs per USB4/Thunderbolt auf Apple Silicon Macs nutzbar machen – ausschließlich für KI-Workloa…

Exa: Nvidia-gefördertes KI-Such-Startup sucht "rebellische" Entwickler für Singapur-Expansion

Exa, das mit 700 Mio. Dollar bewertete KI-Such-Startup, eröffnet ein Büro in Singapur und sucht gezielt nach Entwicklern, die klassische Suchlogik hinter sich l…

Nvidia KVTC: 20x weniger GPU-Speicher, bis zu 8x schnellerer First Token

Nvidias KVTC komprimiert den KV-Cache von LLMs mit Transform-Coding um bis zu 20x und senkt die TTFT laut Studie um bis zu 8x. Das verschiebt Kosten und Skalier…

Nvidia DLSS 5: Generative Grafik kollidiert mit der Art Direction

DLSS 5 verschiebt Grafik von Upscaling zu generativem Neural Rendering. Massive Kritik am Look zwingt Publisher zu klaren Guardrails und EU‑AI‑Act-konformer Gov…

DLSS 5: Nvidia erklärt, warum generative KI kein Stilbruch ist

Jensen Huang verteidigt DLSS 5 als Künstlerwerkzeug, nicht als ästhetischen Filter. Was die "3D-konditionierte" KI technisch bedeutet und was Entscheider wissen…

Jensen Huang erklärt AGI für erreicht: Strategie oder Substanz?

Nvidia-CEO Jensen Huang bezeichnete AGI auf dem Lex Fridman Podcast als bereits erreicht – und ruderte sofort zurück. Eine Analyse zeigt: Dahinter steckt eine g…

Nvidia: 1‑Billion‑Dollar‑Roadmap setzt Branchenstandard bis 2027

Nvidia taxiert Bestellungen für Blackwell/Rubin bis 2027 auf 1 Billion US‑Dollar. Was das für Wettbewerb, Beschaffung und EU‑Compliance bedeutet – komprimiert a…

AWS Trainium: Wie Amazon Nvidias KI-Chip-Monopol unter Druck setzt

AWS Trainium gewinnt Anthropic und OpenAI als Kunden – doch unabhängige Tests zeigen Grenzen. Was Amazons Chip-Strategie für den KI-Infrastrukturmarkt wirklich …

Nvidia DLSS 5: Gen‑KI verändert Gesichter und entzündet einen Kulturkampf

DLSS 5 bringt generative KI in Gesichter und Licht von Games. Wir analysieren Technik, Artefakte, künstlerische Kontrolle – und was der EU AI Act dafür bedeutet…

Nvidia GTC 2026: Was die 1-Billion-Dollar-Prognose von Jensen Huang wirklich bedeutet

Jensen Huang projiziert 1 Billion Dollar KI-Chip-Umsatz bis 2027. Was hinter Blackwell, der OpenClaw-Strategie und den Infrastruktur-Ambitionen von Nvidia steck…

Nvidia DLSS 5: Wenn KI den Pinsel des Künstlers übermalt

Nvidia DLSS 5 nutzt generative KI für fotorealistische Grafik – doch Entwickler fürchten den Verlust kreativer Kontrolle. Was der Präzedenzfall für die Kreativw…

Nvidia GTC: OpenClaw wird zur Chefsache für Enterprise-KI-Agenten

Jensen Huang macht OpenClaw zur Pflichtaufgabe: Ein Framework für Enterprise-Agenten, Security und Hybrid-Infrastruktur – mit klaren Budget- und Teamfolgen bis …

Nvidia GTC 2026: Was hinter der Billionen-Dollar-Prognose wirklich steckt

Nvidia projiziert 1 Billion Dollar AI-Chip-Umsatz bis 2027. Was steckt hinter Blackwell, der OpenClaw-Strategie und den GTC-Ankündigungen? Der Faktencheck.

GTC 2026: Nvidias Plattform-Strategie erzwingt Neuausrichtung der Unternehmens-IT

Nvidias GTC 2026 Keynote zementiert den Wandel zum KI-Ökosystem. Was NemoClaw und neue Inferenz-Chips für die Budgetplanung von Unternehmen bedeuten.

Nvidias Agenten-Monopol: Warum die Kartellbehörden bald hinschauen

Nvidia präsentierte auf der GTC 2026 das Agent Toolkit – 17 Enterprise-Giganten unterschrieben sofort. Was das für Wettbewerb, Lock-in und Kartellrisiken bedeut…

Metas Chip-Krieg: So greift Meta Nvidia frontal an

Meta hat vier neue KI-Chips der MTIA-Serie angekündigt und damit eine klare Botschaft an Nvidia gesendet: Die Abhängigkeit soll enden. Eine strategische Analyse…

📬 KI-News direkt ins Postfach