LLM — PromptLoop Glossar

Was ist ein LLM?

Ein Large Language Model ist ein KI-System, das auf der Transformer-Architektur basiert und darauf trainiert wird, menschliche Sprache statistisch zu modellieren. Das Ziel: das nächste wahrscheinlichste Token in einer Sequenz vorherzusagen — immer und immer wieder, bis daraus kohärente Texte, Antworten oder Code entstehen. Der Begriff "large" bezieht sich dabei auf zwei Dimensionen gleichzeitig: die schiere Menge der Trainingsparameter (oft im Bereich von Milliarden bis Billionen) und das Volumen der Trainingsdaten, das häufig mehr als zehn Billionen Tokens umfasst. LLMs lösen das Problem, das klassische regelbasierte NLP-Systeme nie wirklich lösen konnten: Sprache ist komplex, kontextabhängig und ständig im Wandel. Statt handgefertigter Grammatikregeln lernen LLMs Muster direkt aus den Daten — mit einer Generalisierungsfähigkeit, die frühere Ansätze weit übertrifft. Eng verwandt sind Konzepte wie Foundation Models, Generative AI und Multimodale Modelle, die LLM-Fähigkeiten auf Bilder, Audio und andere Modalitäten ausweiten.

Wie funktioniert ein LLM?

Das Training läuft in zwei Hauptphasen ab. Im Pre-Training wird das Modell auf einem riesigen, unstrukturierten Textkorpus mit Tausenden GPUs oder TPUs über Wochen trainiert — in numerisch effizienten Formaten wie FP8 oder BF16, um Rechenkosten zu reduzieren. Das Ergebnis ist ein Basismodell mit breitem Sprachverständnis, aber ohne spezifische Aufgabenausrichtung. In der zweiten Phase folgt Fine-Tuning — oft via RLHF (Reinforcement Learning from Human Feedback) oder parametereffiziente Methoden wie LoRA — um das Modell auf bestimmte Verhaltensweisen oder Domänen zu spezialisieren. Der eigentliche Mechanismus, der LLMs ihre Stärke gibt, ist der Self-Attention-Mechanismus der Transformer-Architektur: Er erlaubt dem Modell, Beziehungen zwischen beliebig weit entfernten Tokens in einer Sequenz gleichzeitig zu gewichten. Neuere Entwicklungen wie TurboQuant (Google) ermöglichen extreme Modellkompression für schnellere Inferenz bei deutlich geringerem Ressourcenverbrauch — ein wichtiger Schritt hin zu LLMs, die auch auf Edge-Geräten laufen.

LLM in der Praxis

Im Unternehmenseinsatz sind LLMs längst kein Experiment mehr. Drei konkrete Einsatzfelder zeigen die Bandbreite: Erstens Software-Entwicklung — KI-Assistenten auf LLM-Basis übernehmen Autovervollständigung, Code-Review und Debugging direkt in der IDE, was die Entwicklerproduktivität messbar steigert. Zweitens Regulatorische Dokumentenverarbeitung: Die Europäische Arzneimittel-Agentur (EMA) setzt LLM-gestützte Workflows ein, um komplexe Zulassungsdokumente zu verarbeiten und zu klassifizieren — ein Use Case, der zeigt, dass auch hochsensible Branchen die Technologie ernstnehmen. Drittens Agentische Workflows im Gesundheitswesen: LLM-gesteuerte Konversationsagenten begleiten Patienten bei Physical-Activity-Interventionen, führen strukturierte Dialoge über mehrere Schritte und passen ihre Empfehlungen kontextabhängig an — weit über einfache Chatbot-Funktionalität hinaus.

Vorteile und Grenzen

Die Stärken von LLMs liegen in ihrer Vielseitigkeit: Ein einziges vortrainiertes Modell kann mit minimalem Fine-Tuning für Dutzende verschiedene Aufgaben eingesetzt werden. Die Fähigkeit, komplexe Kontexte zu verarbeiten und kohärente Langtext-Ausgaben zu erzeugen, ist mit klassischen Methoden schlicht nicht erreichbar. Auf der anderen Seite stehen reale Schwächen, die man nicht kleinreden sollte: Halluzinationen — also das selbstsichere Generieren falscher Fakten — bleiben ein strukturelles Problem. LLMs haben kein echtes Weltverständnis, sie modellieren Wahrscheinlichkeiten über Tokens. Dazu kommt der erhebliche Ressourcenverbrauch: Training und Betrieb großer Modelle erfordern massive Rechen- und Energiekapazitäten, was sowohl Kosten als auch ökologische Fragen aufwirft. Bias aus den Trainingsdaten überträgt sich ins Modellverhalten — und ist schwer vollständig zu kontrollieren. Fortschritte bei Quantisierung und effizientem Fine-Tuning adressieren einige dieser Grenzen, aber ein allgemeingültiges, fehlerfreies Sprachmodell existiert nicht.

❓ Häufig gestellte Fragen

▶ Was ist der Unterschied zwischen einem LLM und einem klassischen Chatbot?

Ein klassischer Chatbot arbeitet mit fest programmierten Regeln oder einfachen Mustererkennung-Algorithmen und kann nur auf vordefinierte Eingaben reagieren. Ein LLM hingegen generiert Antworten probabilistisch auf Basis von Milliarden gelernter Sprachmuster — es versteht Kontext, führt mehrstufige Dialoge und kann auf völlig neue, nie gesehene Anfragen sinnvoll reagieren.

▶ Wie viele Parameter hat ein typisches LLM?

Die Spanne ist groß: Kompakte, effiziente Modelle für den lokalen Einsatz können wenige Milliarden Parameter haben, während die leistungsstärksten Frontier-Modelle der großen Labs in den Bereich von mehreren Hundert Milliarden bis zu Billionen Parametern reichen. Die Parameterzahl allein ist dabei kein verlässlicher Indikator für Qualität — Trainingseffizienz, Datenselektion und Feintuning spielen eine ebenso wichtige Rolle.

▶ Kann ein LLM auch für nicht-englische Sprachen genutzt werden?

Ja, die meisten modernen LLMs sind multilingual und unterstützen Dutzende bis Hunderte von Sprachen, darunter Deutsch. Die Qualität variiert jedoch je nach Sprache deutlich — Sprachen mit geringerem Anteil an den Trainingsdaten (z. B. weniger verbreitete Regionalsprachen) werden in der Regel schlechter verarbeitet als Englisch oder andere datenreiche Sprachen.

Stand: 17. März 2026