Google hat mit Gemma 4 zwei neue Edge-Modelle vorgestellt, die On-Device-KI auf Smartphones grundlegend verändern sollen: E2B (Effective 2 Billion) und E4B (Effective 4 Billion) aktivieren bei der Inferenz jeweils rund 2,3 bzw. 4,5 Milliarden Parameter und passen mit 4,2 GB bzw. 5,9 GB auf Geräte mit 12 GB RAM oder mehr. Laut offiziellem Android-Developer-Blog sind die Modelle bis zu 4-mal schneller als ihre Vorgänger und verbrauchen auf dem TPU bis zu 60 Prozent weniger Akku – ein Sprung, der für Latenz-kritische Anwendungen wie Echtzeit-Übersetzung oder lokale Sprachverarbeitung entscheidend ist. E2B ist dabei rund dreimal schneller als E4B und damit klar auf maximale Reaktionsgeschwindigkeit ausgelegt, während E4B bei komplexeren Reasoning-Aufgaben die Nase vorn behält.
- Google bringt mit Gemma 4 E2B und E4B zwei neue On-Device-KI-Modelle für Smartphones mit mindestens 12 GB Arbeitsspeicher.
- Die Modelle arbeiten bis zu viermal schneller als ihre Vorgänger und reduzieren den Akkuverbrauch um beachtliche 60 Prozent.
- Während E2B auf maximale Reaktionsgeschwindigkeit bei latenzkritischen Aufgaben zielt, punktet E4B bei komplexem Reasoning.