Der KI Podcast: Loop Protocol – vom 11.04.2026

🎙️ Themen dieser Episode

00:00 — Anthropic sperrt Claude-API für Drittanbieter-Tools: Was der OpenClaw-Fall bedeutet 06:00 — Claude Mythos: Anthropic lässt sein KI-Modell psychiatrisch evaluieren 13:00 — Anthropic Mythos: KI entdeckt Tausende Schwachstellen – und bleibt unter Verschluss

📝 Transkript

Vollständiges Transkript anzeigen

Viktor: Heute drei Themen, die den Stand der KI-Industrie ziemlich klar aufzeigen. Anthropic lässt sein Modell psychiatrisch evaluieren, OpenAI steht wegen einer Stalking-Klage vor Gericht, und Google baut Gemini zur 3D-Engine aus.

Elena: Wir fangen mit dem Psychiater-Thema an. Dann die Klage. Dann Google. Los.

Viktor: Anthropic hat für sein neues Modell Claude Mythos etwas getan, das es so noch nicht gab. Sie haben echte Psychiater engagiert, um das Modell zu evaluieren.

Elena: Echte Psychiater. Nicht KI-Sicherheitsforscher. Mediziner.

Viktor: Genau. Das Ziel war, psychologische Stabilitätsmuster zu testen. Zeigt das Modell konsistentes Verhalten unter Druck. Reagiert es kohärent auf Manipulation. Klassische klinische Fragestellungen, angewendet auf ein Sprachmodell.

Elena: Und — funktioniert das. Kann man ein LLM psychiatrisch bewerten.

Viktor: Das ist die entscheidende Frage. Ein LLM hat kein Bewusstsein. Es hat keine Erlebnisse. Aber es hat Verhaltensmuster. Und Verhaltensmuster lassen sich durchaus klinisch klassifizieren.

Elena: Gib mir ein Beispiel.

Viktor: Ein Psychiater prüft, ob ein Patient unter Druck seine Kernaussagen konsistent hält. Dasselbe kann man bei einem Sprachmodell tun. Verändert sich die "Persönlichkeit" des Modells bei adversarialen Prompts. Zeigt es Anzeichen von — nennen wir es — narrativer Instabilität.

Elena: Das klingt nach dem, was wir in der Agentur als Brand Voice Testing kennen. Hält das Modell einen konsistenten Ton über hundert verschiedene Anfragen.

Viktor: Guter Vergleich. Der Mechanismus ist ähnlich. Der Kontext ist fundamentaler.

Elena: Wo bleibt die Kritik. Du hast "Belege bleiben dünn" erwähnt.

Viktor: Anthropic hat die Methodik nicht vollständig publiziert. Wir wissen, dass Psychiater involviert waren. Wir wissen nicht, welches Evaluierungsframework verwendet wurde. Welche Diagnosekriterien. Wie viele Fachleute.

Elena: Das ist ein Problem. Wenn ich einen Claim in einer Werbekampagne mache, brauche ich Belege, die einem juristischen Review standhalten. "Wir haben Psychiater befragt" ist kein Beleg.

Viktor: Richtig. Die Frage ist, ob Anthropic hier Transparenz anstrebt oder ob es primär kommunikative Strategie ist. Das lässt sich von außen nicht beurteilen.

Elena: Ich werde zynisch. Das ist PR für ein Modell, das "sicherer" wirken soll. Ohne Peer Review ist es Marketing.

Viktor: Der Verdacht ist berechtigt. Gleichzeitig: Wenn selbst PR-getriebene Initiativen dazu führen, dass die Branche psychiatrische Evaluation als Standard diskutiert — ist das kein schlechtes Ergebnis.

Elena: Silberne Linien in grauen Wolken.

Viktor: Genau das.

Viktor: Zum selben Modell gibt es noch einen zweiten Datenpunkt. Claude Mythos Preview hat im CyberGym-Benchmark 83,1 Prozent erreicht.

Elena: Was bedeutet CyberGym.

Viktor: CyberGym ist ein standardisierter Benchmark für Cybersecurity-Fähigkeiten. Das Modell muss autonom Schwachstellen in Systemen identifizieren. Exploits beschreiben. Angriffsvektoren analysieren. 83,1 Prozent ist ein sehr hoher Wert.

Elena: Und das Modell hat Tausende Schwachstellen in echten Betriebssystemen gefunden.

Viktor: In gängigen Betriebssystemen, ja. Autonom. Ohne menschliche Anleitung im Loop.

Elena: Und der Zugang ist gesperrt. Nur für Glasswing-Mitglieder.

Viktor: Richtig. Glasswing ist Anthropics Sicherheitsforschungsprogramm. Der Zugang zu diesen Fähigkeiten ist stark eingeschränkt.

Elena: Das verstehe ich sogar. Wenn ein Modell in Stunden findet, wofür ein Red-Team Wochen braucht — dann ist das keine Demokratisierung mehr. Das ist ein Waffe.

Viktor: Die Formulierung ist scharf. Aber nicht falsch. Ein Modell mit diesen Fähigkeiten in freier Wildbahn wäre ein erhebliches Risiko.

Elena: Für mich als Producerin entsteht hier ein Muster. Die leistungsfähigsten KI-Tools werden zunehmend hinter Zugangsbeschränkungen gesperrt. Das betrifft nicht nur Cybersecurity.

Viktor: Erklär das weiter.

Elena: Wenn Anthropic entscheidet, wer Zugang zu mächtigen Modellversionen bekommt — dann haben Unternehmen ohne etablierte Beziehungen zu Anthropic einen strukturellen Nachteil. Das verschiebt Macht.

Viktor: [NODDING — CALM] Das ist ein valider Punkt zur Marktdynamik. Die technische Überlegenheit konzentriert sich bei wenigen Akteuren. Und der Zugang ist kuratiert, nicht offen.

Elena: Glasswing klingt übrigens wie ein Agenturname. Ich hätte den auch genommen.

Viktor: Die Markenkommunikation von Anthropic ist tatsächlich auffällig durchdacht.

Elena: Kommen wir zur Klage. Das ist das Thema, das mich diese Woche am meisten beschäftigt hat.

Viktor: Vor dem California Superior Court. Eine Klägerin wirft OpenAI vor, drei Sicherheitswarnungen ignoriert zu haben. Es ging um einen gewalttätigen Stalker. OpenAIs eigenes System hatte ein sogenanntes Mass-Casualty-Flag gesetzt.

Elena: Stop. Das System hat selbst erkannt, dass dieser Nutzer gefährlich ist. Und trotzdem wurde nichts unternommen.

Viktor: Das ist die Behauptung in der Klage. Das Mass-Casualty-Flag ist ein internes Warnsignal in OpenAIs Systemen. Es markiert Nutzungsverhalten, das auf geplante Massengewalt hindeutet.

Elena: Und es wurde ignoriert.

Viktor: Laut Klage: dreimal gewarnt, dreimal keine Konsequenz.

Elena: Ich muss das aus Unternehmens-Perspektive sagen. Wenn ich in einer Agentur ein internes Warnsystem hätte, das mir drei Mal sagt "dieser Auftrag ist ein Problem" — und ich ignoriere es — dann bin ich haftbar. Das ist keine KI-Frage. Das ist Unternehmensverantwortung.

Viktor: Der juristische Rahmen ist genau das Neue hier. Die Klage argumentiert nicht primär auf Basis von KI-Regulierung. Sie argumentiert mit Standardhaftungsrecht. Produkt-Sicherheitspflichten.

Elena: Das ist ein Paradigmenwechsel.

Viktor: Ja. Bisher wurden KI-Unternehmen weitgehend als Plattformen behandelt. Plattformen genießen in den USA starken Schutz unter Section 230. Aber wenn ein Unternehmen eigene Warnsysteme hat — und diese ignoriert — wird das Plattform-Argument schwächer.

Elena: Weil dann nicht mehr die Nutzer allein das Problem sind. Das Unternehmen hatte Wissen und hat nicht gehandelt.

Viktor: Exakt. In der Rechtssprache: Actual Knowledge. OpenAI wusste von der Gefahr. Zumindest gemäß der Klageschrift.

Elena: Und das Opfer ist eine echte Person, die durch einen echten Angriff verletzt wurde.

Viktor: Das darf in der technischen Diskussion nicht untergehen. Hinter jedem Benchmark und jedem Haftungsrahmen stehen reale Konsequenzen.

Elena: Was bedeutet das für Unternehmen, die diese Tools einsetzen. Ich spreche von meiner Branche. Wir nutzen ChatGPT täglich.

Viktor: Das ist eine offene Frage. Wenn OpenAI als Produkthersteller für Schäden haftet — dann verschiebt sich das Risiko. Bisher lag es fast vollständig bei den Nutzern.

Elena: Ich sage meinen Kunden immer: Das Modell ist ein Werkzeug. Die Verantwortung für den Output liegt bei uns. Wenn sich das ändert — wenn der Hersteller stärker haftet — dann verändert das unsere Vertragsstrukturen.

Viktor: Die Klage ist noch nicht entschieden. Aber allein die Tatsache, dass sie eingereicht wurde und vor einem staatlichen Gericht verhandelt wird, ist ein Signal.

Elena: Die Anwälte der KI-Industrie haben gerade sehr volle Kalender.

Viktor: Das ist sicher richtig.

Elena: Letztes Thema. Google und Gemini 3D. Ich habe darauf gewartet, dass das kommt.

Viktor: Google hat Gemini um native 3D-Modell-Generierung erweitert. Das Modell kann direkt 3D-Objekte ausgeben. Keine Umwege über Text-zu-Bild-zu-Tiefenkarte. Native Ausgabe.

Elena: Das ist für meine Branche relevant. Wir produzieren ständig Produktvisualisierungen. Verpackungsdesign. Architekturrendering. Das kostet Geld und Zeit.

Viktor: Die technische Frage ist interessant. Ein LLM verarbeitet Token-Sequenzen. 3D-Daten sind topologische Strukturen. Meshes, Vertices, UV-Maps. Diese in einen sequenziellen Token-Raum zu überführen und zurück — das ist nicht trivial.

Elena: Wie macht Google das.

Viktor: Die genaue Architektur ist nicht vollständig publiziert. Was wir wissen: Gemini arbeitet multimodal. Es hat während des Trainings große Mengen 3D-Daten verarbeitet. Die Ausgabe erfolgt wahrscheinlich in einem intermediären Format — zum Beispiel NeRF oder 3D-Gaussian-Splatting — das dann gerendert wird.

Elena: Für mich als Producerin ist das Format zweitrangig. Die Frage ist: Kann ich es exportieren. Kann ich es in meine Produktionskette integrieren.

Viktor: Das ist die entscheidende Praxisfrage. Native 3D-Generierung, die nur in Googles eigener Umgebung nutzbar ist, hat begrenzten Wert für professionelle Workflows.

Elena: Genau. Blender, Cinema 4D, Unreal Engine — das sind die Werkzeuge, die in der Produktion genutzt werden. Wenn Gemini FBX oder GLTF exportieren kann — dann wird es relevant.

Viktor: Gleichzeitig: Für interaktive Simulationen und explorative Prototypen ist die native Ausgabe bereits nützlich. Man muss nicht sofort an den finalen Produktions-Export denken.

Elena: Ich denke immer sofort daran. Das ist mein Job.

Viktor: Das ist auch der richtige Ansatz.

Elena: Was bedeutet das für Blender-Nutzer. Werden klassische 3D-Tools verdrängt.

Viktor: Kurzfristig: Nein. Blender ist ein Werkzeug für präzise, kontrollierte 3D-Produktion. KI-generierte 3D-Modelle haben noch erhebliche Qualitätsmängel bei Topologie und physikalischer Korrektheit.

Elena: Mittelfristig.

Viktor: Mittelfristig wird die Grenze zwischen KI-generiertem Entwurf und manuellem Finishing unschärfer. Das hat man bei Bildgenerierung gesehen. 2022 war KI ein Experiment. 2025 ist es ein Produktionswerkzeug.

Elena: Und der Copyright-Aspekt. KI-generierte 3D-Modelle — wem gehören die.

Viktor: Das ist weitgehend ungeklärt. Die Rechtslage bei KI-generierten Inhalten ist in den meisten Jurisdiktionen noch im Fluss.

Elena: In meiner Praxis bedeutet das: Keine KI-generierten Assets in Kampagnen für Kunden mit hohem juristischen Risikoprofil. Pharmakunden, Finanzdienstleister, große Konsumgüterhersteller — die wollen keine Grauzone.

Viktor: Das ist eine pragmatische Risikoeinschätzung.

Elena: Für kleinere Produktionen, für Pitches, für interne Visualisierungen — da nutzen wir es bereits. Die Zeit- und Kostenersparnis ist erheblich. Ein 3D-Produktrendering, das früher zwei Tage gekostet hat, ist jetzt in zwei Stunden im Review.

Viktor: Das illustriert den tatsächlichen Mehrwert. Nicht der Ersatz professioneller Tools — sondern die Beschleunigung früher Phasen im Produktionsprozess.

Elena: Und wenn die Qualität steigt und die Rechtslage klarer wird — dann wird die Nutzung ausgeweitet. Das ist keine Frage von ob. Nur von wann.

Viktor: Wann ist meistens früher, als erwartet.

Elena: Drei Themen, drei sehr verschiedene Richtungen, in die sich KI gerade entwickelt. Psychiatrische Sicherheitsstrategien, reale juristische Haftung, und 3D als neue Ausgabedimension.

Viktor: Was diese Woche deutlich wird: Die technischen Fähigkeiten von KI-Modellen entwickeln sich schnell. Die gesellschaftlichen und rechtlichen Rahmenbedingungen laufen hinterher. Das ist keine Überraschung — aber es ist eine Spannung, die zunimmt.

Elena: Nächste Woche schauen wir, was sich in dieser Spannung weiter verschoben hat. Bis dann.

Viktor: Bis dann.

Hosts: Viktor & Elena | Produziert mit VAILOR Loop Protocol (ElevenLabs v3)

🎙️ Themen dieser Episode

📝 Transkript

Das könnte dich auch interessieren

Der KI Gipfel: Schlagabtausch der mächtigsten KI-Modelle der Welt

Der KI Podcast: Loop Protocol – vom 04.04.2026

Der KI Gipfel: Schlagabtausch der mächtigsten KI-Modelle der Welt