Anthropic hat den Prompt-Cache-Standard für Claude Code im März 2026 von einer Stunde auf fünf Minuten reduziert, was zu Verwirrung und potenziellen Kostensteigerungen für Entwickler mit langen, kontextreichen Sessions führt. Obwohl Anthropic eine Kostensteigerung bestreitet, zeigt die API-Preisstruktur, dass der 5-Minuten-Cache 25 Prozent mehr kostet als der Grundpreis für Eingabe-Token, während der 1-Stunden-Cache 100 Prozent mehr kostet. Jedoch ist der Lesepreis für den Cache mit zehn Prozent des Grundpreises deutlich günstiger, was für Workflows, die denselben Kontext häufig abrufen, den 1-Stunden-Cache vorteilhafter macht. Für One-Shot-Anfragen ohne Wiederverwendung ist dies jedoch nicht der Fall.
- Anthropic hat den Standard-Cache für Claude Code von einer Stunde auf fünf Minuten reduziert, was bei langen Sitzungen zu spürbaren Mehrkosten führt.
- Ein zusätzlicher Software-Bug im Frühjahr 2026 leerte Nutzer-Budgets rasant, wobei Anthropic im Gegensatz zur Konkurrenz keine Erstattungen anbot.
- Für kontextreiche Workflows sollten Entwickler zwingend den 1-Stunden-Cache manuell konfigurieren, um weitere Kostenexplosionen zu verhindern.
Jarred Sumner von Anthropic argumentiert, dass der Wechsel zum 5-Minuten-Cache Claude Code insgesamt günstiger mache, da ein signifikanter Anteil der Anfragen One-Shot-Calls seien. Entwickler wie Sean Swanson widersprechen jedoch und bezeichnen die 5-Minuten-TTL als „unverhältnismäßig bestrafend“ für die Art von langen und kontextreichen Sessions, für die Claude Code eigentlich konzipiert ist. Zusätzlich wurde die Situation durch einen 28-tägigen Caching-Bug verschärft, der zwischen Anfang März und dem 1. April 2026 aktiv war und bei dem fehlendes Prefix-Caching dazu führte, dass Tokens pro Runde neu verarbeitet wurden. Dies leerte die Nutzerkontingente 10- bis 20-mal schneller als erwartet. Anthropic reagierte darauf verzögert über Social Media und Reddit mit dem Rat zur sparsamen Nutzung, ohne Quota-Anpassungen oder Erstattungen anzubieten, im Gegensatz zu OpenAI, die in einem vergleichbaren Fall Erstattungen vornahmen.
Für Entwickler und Agenturen im DACH-Raum, die Claude-Code-Workflows mit hohem Token-Volumen nutzen, ist es ratsam zu prüfen, ob der 1-Stunden-Cache manuell gesetzt werden kann, insbesondere für lange Sessions mit wiederverwendetem Kontext. Laut Anthropic-Dokumentation ist dies möglich, wobei das 1-Stunden-Tag vor dem 5-Minuten-Tag stehen sollte. Obwohl automatisierte Kostenänderungen in API-Verträgen derzeit kein Compliance-Problem im Rahmen des EU AI Act und der DSGVO darstellen, ist Transparenz bei solchen Änderungen für Unternehmen, die KI-Kosten in ihrer IT-Budgetplanung berücksichtigen, von operativer Bedeutung.
Token-Rechner wird geladen…
❓ Häufig gestellte Fragen
📚 Quellen
- The Register: Claude Code cache confusion as Anthropic tweaks defaults
- Anthropic Docs: Prompt Caching – offizielle Dokumentation