Overfitting — PromptLoop Glossar

Was ist Overfitting?

Overfitting beschreibt den Zustand, in dem ein Machine-Learning-Modell die Trainingsdaten nicht nur in ihren Mustern erfasst, sondern sie buchstäblich memoriert – inklusive Rauschen, Ausreißer und zufällige Eigenheiten des Datensatzes. Das Ergebnis: Das Modell erzielt auf den Trainingsdaten hervorragende Werte, versagt aber bei ungesehenen Daten, weil es schlicht nicht generalisieren kann. Das Gegenstück dazu ist Underfitting, bei dem ein Modell selbst die Trainingsdaten nicht ausreichend erfasst. Der ideale Zustand liegt genau dazwischen – eine gute Bias-Variance-Tradeoff-Balance. Overfitting ist primär ein Problem des Supervised Learning, also überall dort, wo gelabelte Daten zum Einsatz kommen: Regression, Klassifikation, Rankings.

Wie funktioniert Overfitting?

Technisch gesehen entsteht Overfitting, wenn die Kapazität eines Modells – also seine Anzahl an Parametern und Freiheitsgrade – die Komplexität der tatsächlich zugrunde liegenden Datenmuster übersteigt. Ein tiefes neuronales Netz mit Millionen von Gewichten kann bei einem kleinen Trainingsdatensatz jedes einzelne Beispiel in seinen Parametern "abspeichern", anstatt übergeordnete Regeln zu lernen. Mathematisch erhöht das die Varianz des Modells bei gleichzeitig niedrigem Bias. Erkennbar ist Overfitting durch divergierende Loss-Kurven: Der Trainingsloss sinkt stetig, während der Validierungsloss ab einem bestimmten Punkt wieder steigt. Gegenmaßnahmen greifen direkt in diese Dynamik ein: L1- und L2-Regularisierung bestrafen große Gewichtswerte und zwingen das Modell zu Sparsamkeit. Dropout deaktiviert während des Trainings zufällig Neuronen und verhindert so Co-Abhängigkeiten. Early Stopping bricht das Training ab, sobald sich der Validierungsloss verschlechtert. Cross-Validation sorgt dafür, dass die Modellbewertung nicht von einem einzelnen Datensplit abhängt. Hinzu kommen Data Augmentation und Transfer Learning – besonders wirksam, wenn schlicht zu wenige Trainingsdaten vorhanden sind.

Overfitting in der Praxis

Im Bereich Computer Vision ist Overfitting ein klassisches Problem beim Training von Bildklassifikatoren auf kleinen Datensätzen. Ein Modell, das auf 500 Röntgenbilder trainiert wird, kann die individuelle Bildqualität einzelner Aufnahmen statt das tatsächliche Krankheitsmuster lernen – mit potenziell fatalen Konsequenzen im Einsatz. Data Augmentation durch Rotation, Spiegelung und Helligkeitsvariation ist hier ein erprobtes Mittel. Im NLP-Bereich – etwa beim Fine-Tuning von Large Language Models auf domänenspezifische Daten – führt Overfitting dazu, dass das Modell den Jargon eines Unternehmens perfekt nachahmt, dabei aber die Fähigkeit zur allgemeinen Sprachverarbeitung verliert. OpenAI und Hugging Face begegnen dem mit gezielten Regularisierungsstrategien während des Fine-Tunings. Auch im Quantitative Finance ist Overfitting ein bekanntes Schreckgespenst: Handelsalgorithmen, die auf historischen Kursdaten überoptimiert wurden, scheitern im Live-Betrieb systematisch – ein Phänomen, das in der Branche als "Backtest-Overfitting" bekannt ist.

Vorteile und Grenzen

Der Umgang mit Overfitting hat durch AutoML-Tools und integrierte Frameworks wie TensorFlow deutlich niedrigere Einstiegshürden bekommen – viele Gegenmaßnahmen lassen sich heute nahezu automatisch anwenden. Ensemble-Methoden wie Random Forests sind strukturell robuster gegen Overfitting als einzelne tiefe Modelle und bieten damit einen architektonischen Vorteil. Die Grenzen liegen allerdings im Aufwand: Sauberes Feature Engineering, das bis zu 50 % des Projekterfolgs ausmachen kann, ist nach wie vor eine handwerkliche Disziplin, die sich nicht automatisieren lässt. Zudem gibt es keine universelle Lösung – welche Regularisierungstechnik am besten wirkt, hängt stark vom Modelltyp, der Datenmenge und dem Anwendungsfall ab. Und wer seinen Test-Set zu früh und zu oft für Entscheidungen nutzt, hat de facto keinen echten Test-Set mehr – ein Fehler, der in der Praxis häufiger passiert, als Teams zugeben möchten.

❓ Häufig gestellte Fragen

▶ Woran erkenne ich, ob mein Modell overfittet?

Das klassische Warnsignal ist eine große Lücke zwischen Trainings- und Validierungs-Performance. Wenn dein Modell auf den Trainingsdaten eine hohe Accuracy erzielt, auf dem Validierungs- oder Test-Set aber deutlich schlechter abschneidet – oft mehr als 20 Prozentpunkte Unterschied –, ist Overfitting sehr wahrscheinlich. Divergierende Loss-Kurven im Training sind ein weiteres eindeutiges Indiz.

▶ Was ist der Unterschied zwischen Overfitting und Underfitting?

Beim Overfitting hat das Modell zu viel gelernt – es memoriert Trainingsdaten inklusive Rauschen und kann nicht generalisieren (hohe Varianz, niedriger Bias). Beim Underfitting hat es zu wenig gelernt – es erfasst selbst die wesentlichen Muster der Trainingsdaten nicht (hoher Bias, niedrige Varianz). Das Ziel ist ein ausgewogener Bias-Variance-Tradeoff, der auf beiden Datensätzen gute Ergebnisse liefert.

▶ Welche Methoden helfen am effektivsten gegen Overfitting?

Es gibt keine Universallösung, aber bewährte Strategien sind: Regularisierung (L1/L2 und Dropout), Early Stopping, Cross-Validation und das strikte Trennen von Trainings-, Validierungs- und Test-Set. Bei kleinen Datensätzen helfen Data Augmentation und Transfer Learning besonders gut. Für strukturierte Daten sind Ensemble-Methoden wie Random Forests von Haus aus robuster gegen Overfitting als einzelne tiefe Modelle.

Stand: 20. März 2026