Foundation Model — PromptLoop Glossar

Was ist ein Foundation Model?

Ein Foundation Model ist ein großskaliges Machine-Learning-Modell, das auf breiten, diversen Datensätzen — oft Petabytes an Texten, Code, Bildern oder wissenschaftlichen Daten — mit Milliarden bis Billionen von Parametern trainiert wird. Das Kernprinzip: Einmal generalistische Stärke aufbauen, dann für spezifische Aufgaben adaptieren. Dieses Adaptieren erfolgt über Fine-Tuning, Prompting oder Transfer Learning — allesamt Techniken, die den Aufwand für spezialisierte Anwendungen um Größenordnungen reduzieren. Foundation Models sind damit das Gegenteil des alten Ansatzes, für jede Aufgabe ein Modell from scratch zu trainieren. Sie lösen ein fundamentales Ressourcenproblem: Das aufwändige Pre-Training passiert einmal, alle nachgelagerten Anwendungen profitieren davon.

Wie funktioniert ein Foundation Model?

Der Kern ist selbstüberwachtes Lernen (Self-Supervised Learning): Das Modell bekommt keine händisch gelabelten Daten, sondern lernt Strukturen direkt aus dem Rohmaterial — etwa indem es das nächste Token in einer Textsequenz vorhersagt (Autoregressive Language Modeling) oder maskierte Bildbereiche rekonstruiert. Auf diese Weise werden Trillionen von Trainings-Tokens verarbeitet, ohne manuellen Annotation-Aufwand. Die daraus entstehenden Modellgewichte kodieren semantisches Weltwissen, syntaktische Muster und sogar rudimentäres Reasoning. Bei ausreichender Skalierung treten sogenannte emergente Fähigkeiten auf — Kompetenzen wie mehrstufiges logisches Schließen oder domänenübergreifender Transfer, die nicht explizit trainiert wurden. Die Scaling Laws beschreiben diesen Zusammenhang mathematisch: Genauigkeit und Fähigkeiten skalieren vorhersagbar mit Modellgröße, Datenmenge und Rechenbudget. Nach dem Pre-Training folgt in der Regel ein Supervised Fine-Tuning (SFT)-Schritt auf kuratierteren Datensätzen, der das Modell auf Instruction-Following und aufgabenspezifische Outputs trimmt.

Foundation Model in der Praxis

Die Bandbreite realer Einsatzfelder ist bemerkenswert. OpenAIs GPT-Familie treibt Chatbots, Schreibassistenten und Code-Copilots an — Produkte, die täglich von Millionen Developern und Knowledge Workern genutzt werden. Im Healthcare-Bereich entstehen datengetriebene Foundation Models, die medizinische Bilddaten, Patientenakten und genomische Sequenzen gemeinsam verarbeiten, um Diagnoseunterstützung zu leisten. Besonders prägnant ist das Lunar-FM-Projekt einer Raumfahrtbehörde: das weltweit erste Foundation Model für Mondoberflächendaten, das geologische Merkmale analysiert und Geländegrenzen kartiert — ein Use Case, der zeigt, wie das Paradigma weit über Sprach-KI hinausreicht. In Deutschland arbeiten Initiativen wie SOOFI (Sovereign Open Source Foundation Models) daran, lokale Modelle zu entwickeln, die Datensouveränität und regulatorische Anforderungen berücksichtigen.

Vorteile und Grenzen

Der offensichtliche Vorteil: Effizienz durch Wiederverwendung. Wer auf einem vortrainierten Foundation Model aufbaut, spart Rechenkosten und Zeit — Fine-Tuning auf einem starken Basismodell schlägt from-scratch-Training bei Spezialaufgaben regelmäßig. Zudem ermöglichen Foundation Models Zero-Shot- und Few-Shot-Fähigkeiten, also brauchbare Ergebnisse ohne aufwändiges Nachtraining. Auf der Gegenseite stehen erhebliche Schwächen: Das initiale Pre-Training ist extrem ressourcenintensiv — energiehungrig, teuer, nur für eine Handvoll globaler Player leistbar. Bias aus den Trainingsdaten überträgt sich direkt ins Modell und ist schwer vollständig zu eliminieren. Emergente Fähigkeiten sind schwer vorherzusagen und zu kontrollieren, was Sicherheitsfragen aufwirft. Und schließlich: die Abhängigkeit von wenigen zentralen Modellanbietern schafft strukturelle Risiken für Unternehmen, die ihre KI-Infrastruktur darauf aufbauen.

❓ Häufig gestellte Fragen

▶ Was unterscheidet ein Foundation Model von einem normalen KI-Modell?

Ein klassisches KI-Modell wird für eine spezifische Aufgabe trainiert und kann diese gut lösen, aber kaum etwas anderes. Ein Foundation Model hingegen wird auf riesigen, diversen Datensätzen vortrainiert und kann durch Fine-Tuning oder Prompting für viele verschiedene Aufgaben angepasst werden — ohne jedes Mal von Grund auf neu trainiert zu werden.

▶ Wie viel Rechenaufwand steckt im Training eines Foundation Models?

Das Pre-Training der führenden Foundation Models erfordert den Einsatz von Tausenden spezialisierter KI-Chips über Wochen bis Monate und verschlingt Trainingskosten im zwei- bis dreistelligen Millionenbereich. Verarbeitet werden dabei Trillionen von Tokens aus Petabytes an Rohdaten. Deshalb können sich diesen Aufwand nur wenige große Technologieunternehmen und gut finanzierte Startups leisten.

▶ Was bedeutet 'emergente Fähigkeiten' bei Foundation Models?

Emergente Fähigkeiten sind Kompetenzen, die bei einem Modell ab einer bestimmten Größe plötzlich auftreten — obwohl sie nicht explizit trainiert wurden. Typische Beispiele sind mehrstufiges logisches Schließen, das Lösen von Mathematikaufgaben oder das Übersetzen zwischen Sprachen, die im Training kaum präsent waren. Diese Emergenz ist wissenschaftlich noch nicht vollständig verstanden und macht Foundation Models sowohl mächtig als auch schwer vorherzusagen.

Stand: 20. März 2026