GitHub beendet das pauschale Abrechnungsmodell für seinen KI-Assistenten Copilot und wechselt ab dem 1. Juni 2026 von anfragenbasiertem auf token-basiertes Billing. Ausgelöst wurde dieser Schritt durch eine Kostenkrise, da komplexe Codierungs-Sessions GitHub oft mehr kosteten, als die Abonnementgebühren einspielten. Mario Rodriguez, Chief Product Officer bei GitHub, betonte, dass eine schnelle Chat-Frage und eine mehrstündige autonome Codierungssitzung derzeit denselben Betrag kosten, was aufgrund der eskalierenden Inferenzkosten nicht mehr nachhaltig war. Statt Anfragen zählt GitHub ab Juni Tokens, wobei eine virtuelle Währung namens „GitHub AI Credit" eingeführt wird. Ein Credit entspricht dabei exakt 0,01 US-Dollar und dient zur Abrechnung von Input-, Output- und zwischengespeicherten Tokens, die je nach KI-Modell unterschiedlich bepreist werden.
- Ab dem 1. Juni 2026 stellt GitHub für Copilot von einer Flatrate auf ein token-basiertes System mit monatlichen Credit-Kontingenten um.
- Während aufwendige Chat-Anfragen künftig das Budget belasten, bleiben klassische Code-Vervollständigungen weiterhin unbegrenzt nutzbar.
- Besonders Jahresabonnenten spüren höhere Kosten bei rechenintensiven Modellen und müssen ihre Budgets künftig aktiv überwachen.
Die monatlichen Kontingente variieren je nach Abonnement: Copilot Pro (10 $/Monat) erhält 1.000 AI Credits, während der Copilot Pro+ Plan (39 $/Monat) mit 3.900 Credits ausgestattet wird. Für Organisationen im Copilot Business Plan sind 1.900 Credits pro Nutzer vorgesehen, im Copilot Enterprise Plan sind es 3.900 Credits. Bestehende Business- und Enterprise-Kunden profitieren bis zum 1. September 2026 von erhöhten Übergangskontingenten von 3.000 bzw. 7.000 Credits. Nach Erreichen des Limits können Nutzer ein Overflow-Budget definieren oder die Nutzung pausieren. Wichtig: Code-Vervollständigungen und Next Edit Suggestions bleiben unbegrenzt und ohne Credit-Abzug verfügbar.
Für Nutzer bestehender Jahrespläne werden die Auswirkungen besonders spürbar, da sich die Multiplikatoren für rechenintensive Modelle drastisch erhöhen. So steigt der Multiplikator für Claude Opus 4.7 von 7,5x auf 27x und für OpenAI GPT-5.4 von 1x auf 6x. Wer diese Modelle intensiv nutzt, muss mit einer signifikanten Budgetausweitung rechnen. Jahresabonnenten haben die Wahl: Sie können kündigen und eine anteilige Rückerstattung erhalten oder den Plan bis zum Ende der Laufzeit nutzen, wobei eine Verlängerung nicht mehr möglich ist und danach ein Downgrade auf Copilot Free erfolgt.
GitHub steht mit diesem Schritt nicht allein; auch Anthropic und Google haben bereits ähnliche Maßnahmen zur Nutzungsbegrenzung ergriffen. Cloud-Anbieter wie AWS und Azure kämpfen ebenfalls mit Kapazitätsengpässen durch den massiven Anstieg von KI-Agenten. Bereits am 20. April 2026 hatte GitHub die Erstellung neuer Copilot Pro- und Pro+-Pläne vorübergehend ausgesetzt. Für Entwicklerteams bedeutet die Umstellung, dass sie Token-Verbräuche aktiv überwachen und Budgets für die Overflow-Nutzung einplanen müssen. Weitere Details zu den technischen Hintergründen findest du in unserem Glossar unter dem Eintrag "Token-Billing".
Token-Rechner wird geladen…
❓ Häufig gestellte Fragen
📰 Recherchiert auf Basis von 1 Primärquelle (go.theregister.com)
📚 Quellen