Federated Learning — PromptLoop Glossar

Was ist Federated Learning?

Federated Learning ist ein dezentrales Machine-Learning-Paradigma, das das klassische Prinzip „Daten zum Modell bringen" umdreht: Das Modell kommt zu den Daten. Statt Rohdaten zentral zu aggregieren, verbleibt der Datensatz auf dem jeweiligen Gerät oder Server – ob Smartphone, Krankenhaus-Server oder Produktionsanlage. Nur die lokal berechneten Modell-Updates (sogenannte Gradienten oder Gewichtsdifferenzen) werden an einen zentralen Aggregator gesendet, der daraus ein verbessertes globales Modell baut. Das macht Federated Learning zur technischen Antwort auf zwei der drängendsten Konflikte im KI-Betrieb: Datensouveränität versus kollektiver Lernfähigkeit, und regulatorische Compliance versus Modellqualität.

Wie funktioniert Federated Learning?

Ein typischer Federated-Learning-Zyklus läuft in vier Schritten ab. Erstens verteilt ein zentraler Server das aktuelle globale Modell an eine Auswahl teilnehmender Clients. Zweitens trainiert jeder Client das Modell lokal auf seinen eigenen Daten für eine definierte Anzahl von Epochen. Drittens schicken die Clients ausschließlich die berechneten Gewichtsänderungen zurück – nicht die Trainingsdaten. Viertens aggregiert der Server diese Updates, typischerweise via Federated Averaging (FedAvg), und aktualisiert das globale Modell. Dieser Zyklus wiederholt sich iterativ. Kritisch für die Sicherheit ist dabei, dass selbst die übermittelten Gradienten theoretisch Rückschlüsse auf Originaldaten erlauben können – weshalb produktionsreife Implementierungen oft zusätzlich auf Differential Privacy oder Secure Aggregation setzen, um diesen Angriffspfad zu schließen. Eine weitere Herausforderung ist Non-IID-Daten (non-independent and identically distributed): Wenn lokale Datensätze stark voneinander abweichen, konvergiert das globale Modell langsamer oder schlechter.

Federated Learning in der Praxis

Das bekannteste Produktionsbeispiel ist Google Gboard: Die Tastatur-KI lernt Nutzereingaben direkt auf dem Smartphone – kein Tastaturanschlag verlässt das Gerät. Im Gesundheitswesen nutzen Klinikkonsortien Federated Learning, um gemeinsame Diagnosemodelle für Bildgebung oder Genomik zu trainieren, ohne gegen DSGVO oder HIPAA zu verstoßen. Und in der Industrie 4.0 setzen modulare Fertigungsnetzwerke auf verteiltes Lernen, um Predictive-Maintenance-Modelle über Werke hinweg zu verbessern, ohne Produktionsdaten mit Wettbewerbern oder Cloudanbietern zu teilen. Zusätzlich wird Federated Learning zunehmend mit synthetischen Datensätzen kombiniert, um den Datenschutz weiter zu erhöhen und Modelle robuster gegen Re-Identifizierungsangriffe zu machen.

Vorteile und Grenzen

Der offensichtliche Vorteil: Rohdaten verlassen nie ihr Ursprungssystem, was Compliance in regulierten Branchen strukturell vereinfacht. Gleichzeitig können deutlich mehr Datenquellen erschlossen werden, als es bei zentraler Sammlung möglich wäre – das verbessert die Modellgeneralisierung. Auf der Gegenseite stehen echte Schwächen: Der Kommunikations-Overhead durch viele Trainingsrunden ist erheblich, besonders bei bandbreitenlimitierten Edge-Devices. Heterogene Hardware und ungleich verteilte Datensätze erschweren die Konvergenz. Und der Schutz ist kein Freifahrtschein – ohne zusätzliche Maßnahmen wie Differential Privacy können Gradienten-Inversionsangriffe Rückschlüsse auf Trainingsdaten ermöglichen. Federated Learning ist damit kein Privacy-Allheilmittel, sondern eine mächtige erste Verteidigungslinie, die gezielt ergänzt werden muss.

❓ Häufig gestellte Fragen

▶ Was ist der Unterschied zwischen Federated Learning und klassischem Machine Learning?

Beim klassischen Machine Learning werden alle Trainingsdaten zentral gesammelt und dort verarbeitet. Federated Learning dreht dieses Prinzip um: Das Modell wird zu den Daten gebracht, trainiert lokal auf verteilten Geräten oder Servern, und nur die Modell-Updates werden zentral aggregiert. Die Rohdaten verlassen niemals ihr Ursprungssystem.

▶ Wie sicher ist Federated Learning wirklich?

Federated Learning ist eine starke erste Schutzschicht, aber kein vollständiger Datenschutzgarant. Ohne zusätzliche Maßnahmen können sogenannte Gradienten-Inversionsangriffe theoretisch Rückschlüsse auf die lokalen Trainingsdaten erlauben. Produktionsreife Systeme kombinieren Federated Learning daher mit Techniken wie Differential Privacy und Secure Aggregation, um diesen Angriffspfad zu schließen.

▶ Wo wird Federated Learning bereits produktiv eingesetzt?

Bekannte Praxisbeispiele sind Google Gboard (Tastatur-KI lernt direkt auf dem Smartphone), Klinikkonsortien im Gesundheitswesen (gemeinsame Diagnosemodelle ohne Datenaustausch) sowie industrielle Fertigungsnetzwerke für Predictive Maintenance. Überall dort, wo Datenschutz oder Datensouveränität eine zentrale Datensammlung verbieten, ist Federated Learning die pragmatische Alternative.

Stand: 20. März 2026