06.05.2026
Gemma 4 MTP: Google beschleunigt lokale KI-Modelle bis zu 3x mit Speculative Decoding
google/gemma-4-31b-it:free
| Quality Index Artificial Analysis Intelligence Index | — / 100 |
|---|---|
| Output Speed Tokens pro Sekunde | — t/s |
| Latenz (TTFT) Time-to-First-Token | — |
| Preis Input USD je 1 Mio. Input-Tokens | — / 1M |
| Preis Output USD je 1 Mio. Output-Tokens | — / 1M |
| Context Window Maximale Tokens pro Anfrage | — |
| Release Veröffentlichungsdatum | Apr 2026 |
Gemma 4 31B Instruct is Google DeepMind's 30.7B dense multimodal model supporting text and image input with text output. Features a 256K token context window, configurable thinking/reasoning mode, native function...
Wie schlägt sich Google: Gemma 4 31B (free) gegen die Top-Konkurrenz?
Noch keine Vergleichs-Paarungen für dieses Modell verfügbar.
Die letzten Beiträge in unserem Magazin, die dieses Modell behandeln.