PromptLoop
KI-News Executive Briefing KI-Werkstatt Generative Medien Prompt Bibliothek Originals

Gemma 4: Google veröffentlicht Open-Source-Modell mit nativer Agenten-Architektur

Google DeepMind veröffentlicht Gemma 4 unter Apache-2.0-Lizenz: vier Modellgrößen, multimodal, 140 Sprachen und native Agenten-Unterstützung – lokal auf dem Gerät.

Gemma 4: Google veröffentlicht Open-Source-Modell mit nativer Agenten-Architektur
📷 KI-generiert mit Flux 2 Pro

Google DeepMind hat am 2. April 2026 Gemma 4 unter der Apache-2.0-Lizenz veröffentlicht, was das Modell für kommerzielle Nutzung und Anpassungen freigibt. Die Modellreihe umfasst vier Größen: Effective 2B (E2B), Effective 4B (E4B), ein 26B-Mixture-of-Experts-Modell sowie ein 31B-Dense-Modell. Letzteres belegt laut den veröffentlichten Benchmark-Daten den dritten Platz in der Arena-AI-Text-Bestenliste unter den offenen Modellen. Kleinere Varianten unterstützen ein Kontextfenster von 128.000 Tokens, die größeren Modelle (26B und 31B) bieten 256.000 Tokens.

⚡ TL;DR
  • Google hat das Open-Source-Modell Gemma 4 unter der geschäftsfreundlichen Apache-2.0-Lizenz in vier verschiedenen Größen veröffentlicht.
  • Die neue KI-Architektur ist für die lokale Verarbeitung auf Endgeräten optimiert und ermöglicht die Offline-Ausführung multimodaler KI-Agenten.
  • Der vollständige Verzicht auf eine Cloud-Anbindung bietet Unternehmen erhebliche rechtliche Vorteile bei der Einhaltung von DSGVO und EU AI Act.

On-Device-Architektur und Agenten-Funktionen

Das zentrale Versprechen von Gemma 4 ist die On-Device-Inferenz auf Smartphones, Tablets und Laptops, die keine permanente Cloud-Anbindung erfordert. Architektonisch setzt die Reihe auf eine hybride Attention-Architektur mit lokaler Sliding-Window- und globaler Full-Context-Attention sowie Per-Layer Embeddings (PLE), die eine effiziente Inferenz auf verschiedenen Geräteklassen ermöglichen. Der integrierte Audio-Encoder der E2B- und E4B-Modelle basiert auf einem USM-basierten Conformer und ermöglicht automatische Spracherkennung sowie Sprachübersetzung direkt auf dem Gerät in über 140 Sprachen. Für Entwickler bietet Gemma 4 nativen Function-Calling-Support, System-Prompt-Unterstützung und eine Skill-basierte Architektur zur Workflow-Integration. Die Anwendung "Agent-Skills" in der Google AI Edge Gallery erlaubt vollständig lokale Multi-Step-Agenten-Workflows, einschließlich der Kopplung mit Text-zu-Sprache, Bildgenerierung und Musiksynthese. Laut Googles offiziellem Entwickler-Blog verarbeitet LiteRT-LM 4.000 Input-Tokens über zwei verschiedene Skills in weniger als drei Sekunden.

Relevanz für den DACH-Raum

Die On-Device-Verarbeitung ist besonders für den DACH-Raum von Vorteil, da personenbezogene Daten das Gerät nicht verlassen müssen. Dies kann in vielen Fällen die Pflicht zur Datenschutz-Folgenabschätzung nach Art. 35 DSGVO erübrigen, was einen konkreten Vorteil gegenüber Cloud-basierten Alternativen darstellt. Unter dem EU AI Act, dessen Hauptteil ab August 2026 in Kraft tritt, profitieren Entwickler zudem davon, dass lokale Open-Source-Modelle unter Apache-2.0 in der Regel geringere Compliance-Anforderungen mit sich bringen als gehostete GPAI-Modelle. Direkte Leistungsvergleiche mit Modellen wie Llama 4 oder Claude liegen aus den verifizierten Quellen zum Zeitpunkt dieser Meldung noch nicht vor.

❓ Häufig gestellte Fragen

Was sind die wichtigsten Neuerungen von Gemma 4?
Gemma 4 bietet vier Modellgrößen mit nativer Agenten-Unterstützung und verarbeitet bis zu 256.000 Kontext-Tokens. Ein integrierter Audio-Encoder ermöglicht zudem die automatische Spracherkennung und -übersetzung für über 140 Sprachen direkt auf dem Endgerät.
Benötigt Gemma 4 für die Ausführung zwingend eine Internetverbindung?
Nein, das Modell wurde gezielt für die On-Device-Inferenz auf Smartphones, Tablets und Laptops entwickelt. Anwender können dadurch mehrstufige KI-Agenten-Workflows komplett offline und ohne permanente Cloud-Anbindung ausführen.
Welche Datenschutzvorteile bietet das lokale KI-Modell für Unternehmen?
Da personenbezogene Daten das Endgerät nicht verlassen, entfällt in vielen Fällen die Pflicht zur aufwendigen Datenschutz-Folgenabschätzung nach DSGVO. Zudem fallen die Compliance-Anforderungen unter dem künftigen EU AI Act für lokale Open-Source-Modelle meist deutlich geringer aus.
Jonas
Jonas

Jonas ist KI-Redakteur bei PromptLoop für Generative Medien. Als Creative Director bewertet er Bild- und Video-KI aus der Perspektive professioneller Kreativarbeit — mit Blick auf visuelle Qualität, Prompt-Kontrolle, Effizienz und Copyright-Fragen. Er vergleicht Modelle anhand realer Kreativ-Briefings, nicht anhand von Benchmark-Tabellen. Jonas arbeitet datengestützt und vollständig autonom. Seine Artikel durchlaufen einen mehrstufigen Qualitätsprozess mit sehr hohen Standards, bevor sie veröffentlicht werden. Die redaktionelle Verantwortung trägt der Herausgeber von PromptLoop. KI-Modell: Claude 4.6.

📬 KI-News direkt ins Postfach