Gemma 4 E2B/E4B: Googles Edge-Modelle sind bis…

Gemma 4 E2B/E4B: Googles Edge-Modelle sind bis zu 4x schneller und brauchen 60% weniger Akku

Google Gemma 4 E2B und E4B bringen On-Device-KI auf Smartphones mit bis zu 4x mehr Geschwindigkeit und 60% weniger Akkuverbrauch gegenüber der Vorgängergeneration.

Jonas

11. April 2026, 12:15 Uhr ·1 Min. Lesezeit

Google hat mit Gemma 4 zwei neue Edge-Modelle vorgestellt, die On-Device-KI auf Smartphones grundlegend verändern sollen: E2B (Effective 2 Billion) und E4B (Effective 4 Billion) aktivieren bei der Inferenz jeweils rund 2,3 bzw. 4,5 Milliarden Parameter und passen mit 4,2 GB bzw. 5,9 GB auf Geräte mit 12 GB RAM oder mehr. Laut offiziellem Android-Developer-Blog sind die Modelle bis zu 4-mal schneller als ihre Vorgänger und verbrauchen auf dem TPU bis zu 60 Prozent weniger Akku – ein Sprung, der für Latenz-kritische Anwendungen wie Echtzeit-Übersetzung oder lokale Sprachverarbeitung entscheidend ist. E2B ist dabei rund dreimal schneller als E4B und damit klar auf maximale Reaktionsgeschwindigkeit ausgelegt, während E4B bei komplexeren Reasoning-Aufgaben die Nase vorn behält.

⚡ TL;DR

Google bringt mit Gemma 4 E2B und E4B zwei neue On-Device-KI-Modelle für Smartphones mit mindestens 12 GB Arbeitsspeicher.
Die Modelle arbeiten bis zu viermal schneller als ihre Vorgänger und reduzieren den Akkuverbrauch um beachtliche 60 Prozent.
Während E2B auf maximale Reaktionsgeschwindigkeit bei latenzkritischen Aufgaben zielt, punktet E4B bei komplexem Reasoning.

❓ Häufig gestellte Fragen

▶ Welche Systemanforderungen haben die neuen Gemma-4-Edge-Modelle?

Die neuen KI-Modelle erfordern Smartphones mit mindestens 12 GB RAM. Das E2B-Modell belegt dabei 4,2 GB Speicherplatz, während die leistungsstärkere E4B-Variante 5,9 GB benötigt.

▶ Wie sehr verbessern die Modelle die Geschwindigkeit und den Akkuverbrauch?

Im Vergleich zur Vorgängergeneration arbeiten die Edge-Modelle bis zu viermal schneller. Gleichzeitig konnte der Akkuverbrauch für diese Aufgaben auf dem TPU um satte 60 Prozent gesenkt werden.

▶ Worin unterscheiden sich E2B und E4B im täglichen Einsatz?

Das schlankere E2B-Modell läuft etwa dreimal schneller als das E4B und ist ideal für latenzkritische Reaktionsgeschwindigkeiten, wie etwa Echtzeit-Übersetzungen. Das E4B-Modell spielt seine Stärken hingegen bei komplexeren Reasoning-Aufgaben aus.

📚 Quellen

❓ Häufig gestellte Fragen

Das könnte dich auch interessieren

VimRAG: Alibabas Tongyi Lab löst das State-Blind-Spot-Problem bei Multimodal RAG

ClearScore ACBP: Neuer Standard macht KI-Agenten zu compliance-fähigen Kreditvermittlern

Anthropic sperrt Claude-API für Drittanbieter-Tools: Was der OpenClaw-Fall bedeutet