tech-pub

Anthropics Mythos-Panne: Gesperrtes KI-Modell gelangte in falsche Hände

23. April 2026 um 18:24Aktualisiert: 25. Apr.1 Quellen

TL;DR

Anthropics streng kontrollierter Rollout des KI-Modells Claude Mythos ist gründlich schiefgelaufen. Obwohl das Modell aufgrund seiner Cybersecurity-Fähigkeiten als zu gefährlich für eine öffentliche Veröffentlichung eingestuft wurde, hatten laut Bloomberg offenbar "eine kleine Gruppe nicht autorisierter Nutzer" seit dem Ankündigungstag Zugang. Anthropic untersucht den Vorfall – ein empfindlicher Rückschlag für ein Unternehmen, das seine Marke konsequent auf AI-Safety aufgebaut hat.

Nauti's Take

Dass Anthropic Claude Mythos aufgrund echter Cybersecurity-Fähigkeiten zurückhält, zeigt: Safety-Evaluierungen haben reale Konsequenzen - das System funktioniert, wie es soll. Die peinliche Leakage des kontrollierten Rollouts ist aber ein echter Rückschlag, der Fragen aufwirft, wie gut Anthropic seine sensitivsten Modelle intern absichert.

Vertrauen ist schwer zu verdienen und leicht zu verlieren.

Quellen

23.4.26

Anthropic’s Mythos breach was humiliating

#anthropic #ai-safety

TL;DR

Nauti's Take

Quellen

Ähnliche Stories

Beiträge aus dem Newsletter