Fine-Tuning — PromptLoop Glossar

Was ist Fine-Tuning?

Fine-Tuning ist eine Form des Transfer Learning: Du nimmst ein Modell, das bereits auf riesigen Datenmengen vortrainiert wurde – einem sogenannten Foundation Model – und trainierst es auf einem kleineren, domänenspezifischen Datensatz weiter. Ziel ist es, das Modell für eine konkrete Downstream-Aufgabe zu spezialisieren, ohne das aufwendige Pretraining von Grund auf zu wiederholen. Das Konzept löst ein zentrales Problem: Generische Modelle kennen die Welt, aber nicht dein Unternehmen, deine Fachsprache oder deine Compliance-Anforderungen.

Wie funktioniert Fine-Tuning?

Technisch gesehen werden beim klassischen Fine-Tuning die Gewichte des neuronalen Netzes durch weiteres Gradientenabstieg-Training auf neuen Daten angepasst. Dabei bleiben frühere Schichten häufig eingefroren – sie kodieren grundlegende Sprachmerkmale, die erhalten bleiben sollen – während spätere Schichten task-spezifisch aktualisiert werden. Ein zentrales Problem bei vollem Fine-Tuning ist der massive Rechenaufwand: Alle Parameter eines großen Modells zu optimieren, bleibt teuer. Hier setzt LoRA (Low-Rank Adaptation) an: Statt alle Gewichte zu verändern, werden nur niedrigrangige Matrizen trainiert, die als Adapter auf das Originalmodell aufgesetzt werden – mit drastisch reduziertem Speicher- und Rechenaufwand. Ergänzend dazu kommen Alignment-Techniken wie RLHF (Reinforcement Learning from Human Feedback) oder DPO (Direct Preference Optimization) zum Einsatz, die das Modell nicht nur fachlich, sondern auch in Ton, Stil und Compliance-Verhalten formen. Der typische Prozess folgt vier Schritten: Bedarfsanalyse, Datenvorbereitung (Bereinigung, Annotation, Selektion), Hyperparameter-Tuning und abschließendes Alignment.

Fine-Tuning in der Praxis

Im Medizinbereich werden Modelle wie Llama 3 oder Mistral auf klinischen Notizen und Fachliteratur feinjustiert, um präzise Diagnoseunterstützung zu liefern – ohne sensitive Patientendaten in externe APIs zu senden. Rechts- und Finanzdienstleister nutzen Fine-Tuning, um Modelle auf Vertragssprache oder regulatorische Texte zu spezialisieren, was Halluzinationsraten bei Fachbegriffen signifikant senkt. Im Kundensupport von SaaS-Unternehmen entstehen durch Fine-Tuning interne Assistenten, die Produktdokumentation, Tickethistorie und Tonalität des Unternehmens kennen – etwas, das RAG (Retrieval-Augmented Generation) allein nicht leisten kann, da RAG Modellgewichte unverändert lässt und nur dynamisch Kontext einbindet.

Vorteile und Grenzen

Der offensichtliche Vorteil: Fine-Tuning reduziert den Trainingsaufwand um Größenordnungen gegenüber einem vollständigen Pretraining. Unternehmen mit überschaubaren domänenspezifischen Datensätzen können so wettbewerbsfähige Modelle aufbauen, ohne das Budget eines Tech-Konzerns. Durch Methoden wie LoRA ist dieser Prozess inzwischen auch auf Consumer-Hardware durchführbar. Die Grenzen sind jedoch real: Fine-Tuning verändert Modellparameter dauerhaft – wer dynamische, tagesaktuelle Informationen braucht, kommt an RAG oder hybriden Ansätzen nicht vorbei. Overfitting auf kleine Datensätze ist ein konstantes Risiko, besonders wenn die Trainingsdaten wenig Diversität aufweisen. Und schließlich: Schlechte Eingabedaten produzieren schlechte Modelle – die Qualität der Datenvorbereitung entscheidet letztlich über Erfolg oder Misserfolg des gesamten Prozesses.

❓ Häufig gestellte Fragen

▶ Was ist der Unterschied zwischen Fine-Tuning und RAG?

Fine-Tuning verändert die Gewichte eines Modells dauerhaft durch zusätzliches Training auf neuen Daten. RAG (Retrieval-Augmented Generation) lässt die Modellgewichte unverändert und bindet stattdessen zur Laufzeit dynamisch externe Informationen als Kontext ein. Fine-Tuning eignet sich für stabile Domänenkenntnisse und Stil, RAG für aktuelle oder häufig wechselnde Informationen.

▶ Wie viele Daten brauche ich für Fine-Tuning?

Das hängt stark von der Aufgabe und dem Ausgangsmodell ab. Für einfache Stil- oder Tonanpassungen können wenige Hundert hochwertige Beispiele ausreichen. Für komplexe Domänenanpassungen – etwa in der Medizin oder im Recht – sind typischerweise mehrere Tausend annotierte Datenpunkte empfehlenswert. Entscheidend ist weniger die Menge als die Qualität und Relevanz der Trainingsdaten.

▶ Was ist LoRA und warum ist es beim Fine-Tuning wichtig?

LoRA (Low-Rank Adaptation) ist eine effiziente Fine-Tuning-Methode, bei der nicht alle Modellparameter, sondern nur kleine zusätzliche Matrizen mit niedrigem Rang trainiert werden. Das reduziert den Speicher- und Rechenaufwand drastisch und macht Fine-Tuning auch auf begrenzter Hardware praktikabel. LoRA hat sich als Standard-Methode für kosteneffizientes Fine-Tuning großer Sprachmodelle etabliert.

Stand: 20. März 2026