Anthropics Mythos-Panne: Gesperrtes KI-Modell gelangte in falsche Hände
TL;DR
Anthropics streng kontrollierter Rollout des KI-Modells Claude Mythos ist gründlich schiefgelaufen. Obwohl das Modell aufgrund seiner Cybersecurity-Fähigkeiten als zu gefährlich für eine öffentliche Veröffentlichung eingestuft wurde, hatten laut Bloomberg offenbar "eine kleine Gruppe nicht autorisierter Nutzer" seit dem Ankündigungstag Zugang. Anthropic untersucht den Vorfall – ein empfindlicher Rückschlag für ein Unternehmen, das seine Marke konsequent auf AI-Safety aufgebaut hat.
Nauti's Take
Dass Anthropic Claude Mythos aufgrund echter Cybersecurity-Fähigkeiten zurückhält, zeigt: Safety-Evaluierungen haben reale Konsequenzen - das System funktioniert, wie es soll. Die peinliche Leakage des kontrollierten Rollouts ist aber ein echter Rückschlag, der Fragen aufwirft, wie gut Anthropic seine sensitivsten Modelle intern absichert.
Vertrauen ist schwer zu verdienen und leicht zu verlieren.