Gemini 3.1 Flash Live: Google bringt…

Gemini 3.1 Flash Live: Google bringt Echtzeit-Audio mit 90,8 % Function-Calling-Präzision

Google hat Gemini 3.1 Flash Live vorgestellt: ein Echtzeit-Audio-Modell mit 90,8 % Function-Calling-Präzision und SynthID-Wasserzeichen für mehr Transparenz.

Jonas

27. März 2026, 08:36 Uhr ·2 Min. Lesezeit

Google hat mit Gemini 3.1 Flash Live ein neues, auf Echtzeit-Audio spezialisiertes KI-Modell vorgestellt, das die Präzision beim Function Calling erheblich verbessert und nun 90,8 Prozent im ComplexFuncBench für Audio erreicht. Dies stellt einen signifikanten Fortschritt gegenüber dem Vorgängermodell dar und positioniert das neue Modell als vielversprechende Preview für die Integration in Backend-Systeme per Audio, trotz nach wie vor bestehender Herausforderungen bei der Erkennung von Unterbrechungen in Gesprächen. Das Modell ist bereits in Google AI Studio, der Gemini API und Gemini Enterprise sowie in Gemini Live und Search Live verfügbar.

⚡ TL;DR

Google hat Gemini 3.1 Flash Live als KI-Modell für Echtzeit-Audio mit 90,8 % Function-Calling-Präzision vorgestellt.
Das Modell ist bereits in wichtigen Google-Diensten verfügbar und verbessert die Verarbeitung akustischer Nuancen, um Unterbrechungen in Gesprächen robuster zu handhaben.
Google integriert SynthID-Wasserzeichen zur Kennzeichnung von KI-generierten Inhalten, was im Kontext des EU AI Act an Bedeutung gewinnt.

Die Fähigkeit, akustische Nuancen wie Tonhöhe und Sprechgeschwindigkeit zu verarbeiten, macht Gemini 3.1 Flash Live robuster im Umgang mit Gesprächsunterbrechungen, wenn auch hier noch Verbesserungspotenzial besteht, um die Leistung nicht-konversationeller Audiomodelle zu erreichen. Google integriert zudem SynthID-Wasserzeichen, um KI-generierte Inhalte maschinell detektierbar zu machen. Unternehmen, insbesondere in der EU, müssen bei der Nutzung des Modells die Bestimmungen des EU AI Act beachten, die eine Kennzeichnungspflicht für KI-generierte Inhalte und Transparenz gegenüber Endnutzern vorschreiben.

❓ Häufig gestellte Fragen

▶ Was ist Gemini 3.1 Flash Live?

Gemini 3.1 Flash Live ist ein neues, von Google entwickeltes KI-Modell, das speziell für Echtzeit-Audio optimiert wurde. Es steigert die Präzision beim Function Calling erheblich und kann per Audio in Backend-Systeme integriert werden.

▶ Welche Vorteile bietet Gemini 3.1 Flash Live gegenüber früheren Modellen?

Das Modell erreicht eine beeindruckende Function-Calling-Präzision von 90,8 % und ist besser darin, akustische Nuancen wie Tonhöhe und Sprechgeschwindigkeit zu verarbeiten. Dies macht es robuster im Umgang mit Gesprächsunterbrechungen.

▶ Warum sind SynthID-Wasserzeichen bei Gemini 3.1 Flash Live wichtig?

SynthID-Wasserzeichen ermöglichen die maschinelle Erkennung von KI-generierten Inhalten. Dies ist entscheidend, da der EU AI Act eine Kennzeichnungspflicht für solche Inhalte und Transparenz gegenüber Endnutzern vorschreibt.

📚 Quellen

Ars Technica: The debut of Gemini 3.1 Flash Live could make it harder to know if you're talking to a robot
Google Blog: Gemini 3.1 Flash Live – Offizielle Ankündigung

❓ Häufig gestellte Fragen

Das könnte dich auch interessieren

Indiens Filmbranche setzt auf KI: Während Hollywood bremst, drückt Bollywood aufs Tempo

Apple Silicon: Tiny Corp bringt Nvidia- und AMD-eGPUs für KI-Workloads auf den Mac

UK umwirbt Anthropic: Starmer-Regierung nutzt Pentagon-Streit für KI-Offensive