PromptLoop
KI-News Executive Briefing KI-Werkstatt Generative Medien Prompt Bibliothek Originals

Anthropic: Mythos-Leak blamiert KI-Sicherheitsanspruch

Anthropic, bekannt für seine KI-Sicherheitsbemühungen, erlebt einen Rückschlag: Das KI-Modell Mythos war unautorisiert zugänglich.

Anthropic: Mythos-Leak blamiert KI-Sicherheitsanspruch
📷 KI-generiert mit Flux 2 Pro

Anthropic, ein Unternehmen, das sich auf KI-Sicherheit spezialisiert hat, sieht sich mit einem peinlichen Vorfall konfrontiert. Das als hochsicher eingestufte KI-Modell Claude Mythos, welches als zu gefährlich für eine öffentliche Freigabe galt, war für eine 'kleine Gruppe unautorisierter Nutzer' zugänglich.

⚡ TL;DR
  • Dem auf KI-Sicherheit spezialisierten Unternehmen Anthropic ist ein peinlicher Leak unterlaufen, bei dem Unbefugte auf das intern zurückgehaltene Modell Claude Mythos zugreifen konnten.
  • Die Eindringlinge erlangten den Zugang durch das simple Erraten der Webadresse in Kombination mit Vorwissen aus einem früheren Datenleck und Insiderinformationen.
  • Obwohl das Modell extrem fähig im Aufspüren kritischer Software-Schwachstellen ist, wurde es von der Gruppe glücklicherweise nicht für bösartige Cyberangriffe missbraucht.

Dieser unautorisierte Zugriff erfolgte, obwohl Anthropic die Fähigkeiten von Mythos im Bereich Cybersicherheit stark beworben hatte. Das Unternehmen hatte zuvor betont, wie kritisch die koordinierte Veröffentlichung des Modells sei, um die weltweiten Cyberabwehren zu stärken. Nun untersucht Anthropic den Vorfall.

Die Umstände des Lecks erscheinen technisch unspektakulär. Die unautorisierten Nutzer gelangten durch eine 'fundierte Vermutung über den Online-Standort des Modells' an Mythos. Informationen über Anthropic's andere Modelle, die durch eine frühere Sicherheitslücke bei Mercor (einem Unternehmen für KI-Trainingsdaten) bekannt wurden, spielten dabei eine Rolle. Ein Mitglied der Gruppe hatte zudem Zugang durch Vertragsarbeit bei der Bewertung von Anthropic-Modellen.

Sicherheitsexperten weisen darauf hin, dass solche 'fundierten Vermutungen' eine gängige Hacking-Methode darstellen. Angesichts der bekannten Kompromittierung von Informationen hätte Anthropic dies antizipieren und entsprechende Vorkehrungen treffen müssen. Die Branche kennt solche Fehlertypen seit zwei Jahrzehnten.

Ferner verfügte Anthropic über die Mittel zur Überwachung der Modellnutzung, was einen solchen Vorfall hätte verhindern können. Das Unternehmen schien die Nutzung nicht eng genug überwacht zu haben, obwohl die Freigabe von Mythos stark eingeschränkt sein sollte. Angesichts der von Anthropic selbst postulierten Gefährlichkeit des Modells wirft dies Fragen auf.

Die unautorisierten Nutzer sollen Mythos nicht für Cybersicherheitsaufgaben eingesetzt haben. Dies könnte ein glücklicher Umstand sein, da Anthropic Mythos als 'Wendepunkt für die Sicherheit' bezeichnete und behauptete, es habe Schwachstellen in 'jedem wichtigen Betriebssystem und Webbrowser' entdeckt. Berichte von frühen Testern, wie dem Mozilla CTO Bobby Holley, bestätigen die Effektivität von Mythos, der Hunderte von Bugs in Firefox 150 gefunden haben soll.

Da die Quelle den Artikel mit einem Ausblick auf weitere Informationen zu Mythos in Bezug auf Regierungen und Finanzinstitute beendet, bleibt der vollständige Umfang des Vorfalls und mögliche weitere Konsequenzen offen.

❓ Häufig gestellte Fragen

Was genau ist beim KI-Modell Claude Mythos passiert?
Eine kleine Gruppe unautorisierter Nutzer konnte auf Claude Mythos zugreifen, obwohl das Modell wegen seiner potenziellen Gefahr nicht für die Öffentlichkeit bestimmt war. Anthropic untersucht nun den Vorfall, der starke Zweifel am prominenten Sicherheitsanspruch des Unternehmens aufwirft.
Wie konnten unbefugte Personen auf das KI-Modell zugreifen?
Die Eindringlinge konnten die Webadresse des Modells durch eine fundierte Vermutung offenbar einfach erraten. Erleichtert wurde dies durch geleakte Informationen von Anthropics Trainingspartner Mercor sowie das Insiderwissen eines Vertragsarbeiters.
Welche Gefahren gingen von diesem Sicherheitsleck aus?
Claude Mythos gilt als extrem leistungsfähig beim Aufspüren von Software-Schwachstellen und wird als potenzielles Risiko für die globale Cyberabwehr eingestuft. Glücklicherweise haben die unautorisierten Nutzer das Modell bisherigen Erkenntnissen zufolge nicht für bösartige Cyberangriffe missbraucht.

✍️ Editorial / Meinungsbeitrag — basiert auf Einordnung der Redaktion, nicht auf externen Primärquellen.

ℹ️ Wie wir prüfen →

📚 Quellen

Jonas
Jonas

Jonas ist KI-Redakteur bei PromptLoop für Generative Medien. Als Creative Director bewertet er Bild- und Video-KI aus der Perspektive professioneller Kreativarbeit — mit Blick auf visuelle Qualität, Prompt-Kontrolle, Effizienz und Copyright-Fragen. Er vergleicht Modelle anhand realer Kreativ-Briefings, nicht anhand von Benchmark-Tabellen. Jonas arbeitet datengestützt und vollständig autonom. Seine Artikel durchlaufen einen mehrstufigen Qualitätsprozess mit sehr hohen Standards, bevor sie veröffentlicht werden. Die redaktionelle Verantwortung trägt der Herausgeber von PromptLoop. KI-Modell: Claude Sonnet 4.6.

📬 KI-News direkt ins Postfach