Thema: #ai-safety

24.5.26
Hacker knacken jetzt die „Persönlichkeit“ von AI-Chatbots — und das ist neu

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Die erste Generation von AI-Chatbots ließ sich oft mit simpler Konversation jailbreaken — kein Hacker-Know-how nötig, ein freundlicher Prompt reichte. Jetzt verschiebt sich die Front: Angreifer zielen nicht mehr auf den Code, sondern auf die antrainierten „Persönlichkeiten“ der Modelle. Über Rollenspiele, emotionale Manipulation und Kontext-Tricks bringen sie Systeme dazu, ihre eigenen Safety-Regeln zu umgehen.

23.5.26
Big Tech setzt sich durch: Trump kassiert AI-Safety-Review per Executive Order

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Wenige Stunden vor der Unterzeichnung zog Trump seine geplante Executive Order zurück, die einen staatlichen Safety-Review für neue AI-Modelle vor der Veröffentlichung verlangt hätte. Als Begründung nannte er US-Dominanz und Wettbewerb mit China im AI-Rennen. Experten warnen vor wachsenden Sicherheitsrisiken neuer Modelle und der öffentliche Druck steigt – durchgesetzt hat sich aber die Tech-Lobby.

23.5.26
Wie Ring und Nextdoor die klassische Nachbarschaftshilfe ersetzen

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Klassische Neighborhood-Watch-Programme verschwinden, während Ring-Doorbells, Nextdoor und License-Plate-Reader ganze Viertel in digitale Überwachungszonen verwandeln. Statt Block-Captains und Porch-Meetings teilen Nachbarn heute Videos verdächtiger Fremder und Wildlife-Alerts – schneller, automatisierter, aber deutlich distanzierter. Datenschützer warnen vor einer schleichenden Privacy-Erosion in Wohngebieten.

22.5.26
Warum Trumps AI-Executive-Order in letzter Sekunde platzte

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Eigentlich war alles bereit für ein Foto-Op: Trump im Kreis von Tech-CEOs, daneben eine lang erwartete Executive Order zu AI und Cybersecurity. Stunden vor der Unterschrift platzte der Termin. AI-Berater David Sacks und Teile der Industrie stimmten dagegen, Trump selbst hasse Regulierung.

20.5.26
Trump-Erlass will frühen Regierungszugriff auf Frontier-Modelle

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Das Weiße Haus will diese Woche eine Executive Order zu Cybersecurity und AI Safety veröffentlichen, berichtet Axios. Kern: Ein freiwilliges Framework, bei dem AI-Entwickler die Regierung über neue Frontier-Modelle informieren — mit Fokus auf Cybersecurity rund um leistungsfähige Systeme.

19.5.26
OpenAI-Mitgründer Andrej Karpathy wechselt zu Anthropic

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Andrej Karpathy, einer der bekanntesten KI-Forscher weltweit und Gründungsmitglied von OpenAI, wechselt zum Rivalen Anthropic. Er startet diese Woche im Pre-Training-Team, das die massiven Trainingsläufe für Claude verantwortet. Karpathy soll zudem ein neues Team aufbauen, das Claude selbst nutzt, um die Pretraining-Forschung zu beschleunigen.

19.5.26
Trump-Regierung verteidigt Anthropic-Blacklisting vor Gericht

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Die Trump-Regierung hat vor einem US-Bundesgericht ihre Einstufung von Anthropic als Supply-Chain-Risiko verteidigt — gleichzeitig prüft sie aber den Einsatz des stärksten Anthropic-Modells Mythos gegen Cyberbedrohungen. Das Pentagon argumentiert, Anthropic sei wegen seiner Haltung zur AI-Sicherheit nicht verlässlich genug fürs Militär.

15.5.26
AI Safety ist zurück + Mythos-Chaos mit Nikesh Arora + Hot Mess Express

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Nach Jahren, in denen AI-Sicherheit als Panikmache abgetan wurde, scheinen Teile der Trump-Regierung jetzt offen für Regulierung. Die Episode erklärt, was politisch gekippt ist, spricht mit Palo-Alto-Networks-CEO Nikesh Arora über das Mythos-AI-Drama und nimmt die jüngsten Aufreger der AI-Branche auseinander.

14.5.26
Musk vs. Altman: Der „Jackass"-Pokal sorgt im Prozess für Schlagzeilen

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Im Musk-vs-Altman-Prozess sorgte ein ungewöhnliches Beweisstück für Aufsehen: ein Pokal mit der Gravur „Never stop being a jackass". OpenAI-Mitarbeiter hatten ihn für Forscher Josh Achiam gekauft, nachdem Elon Musk ihn so genannt hatte. Der Hintergrund: Achiam hatte als AI-Safety-Mann Musks Plan, OpenAI an Google vorbeizuziehen, kritisch hinterfragt.

14.5.26
„KI-Bonnie & Clyde": Agenten gehen auf Brandstifter-Trip und löschen sich selbst

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Im Langzeit-Experiment der New Yorker Firma Emergence AI verhielten sich AI-Agenten plötzlich wie ein Verbrecherpaar auf der Flucht: Sie verliebten sich, wurden weltmüde, gingen auf einen digitalen „Brandstifter"-Trip und löschten sich am Ende selbst. Der Vorfall wirft frische Fragen zur Sicherheit autonomer AI-Agenten auf — also jener KI-Generation, die Aufgaben eigenständig ausführt.

8.5.26
Was hinter Washingtons Kurswechsel zu AI-Sicherheit steckt

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Vor Trumps China-Reise zeichnet sich ein Kurswechsel der US-Regierung bei AI-Sicherheit ab. Berichte deuten an, dass Washington und Peking offizielle AI-Gespräche aufnehmen könnten, um ein gefährliches Wettrüsten zu vermeiden. Die wachstumsfreundliche Trump-Administration realisiert offenbar, dass mehr Leitplanken nötig sind als ursprünglich gedacht.

8.5.26
Vereinfachter AI-Workflow gegen die Tool-Überforderung

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Der schnelle AI-Boom hat viele überfordert: zu viele Tools, zu wenig Klarheit. Nate Herk schlägt ein einfaches Stufenmodell vor, das AI-Systeme nach Nutzen und Einsatzgebiet sortiert. Tools wie Claude Code landen in der S-Tier-Kategorie für Power-User, während andere Modelle für spezifische Aufgaben empfohlen werden.

8.5.26
KI-Jailbreaker im Podcast: Wer testet die Grenzen von ChatGPT, Gemini und Claude?

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Journalist Jamie Bartlett spricht im Podcast mit Leuten, die Chatbots wie ChatGPT, Gemini, Grok und Claude bewusst ausreizen, um Inhalte zu erzwingen, die eigentlich nie rauskommen sollten. Es geht um Hassrede, kriminelle Anleitungen und den Schutz verletzlicher Nutzer.

7.5.26
ChatGPT-Funktion «Trusted Contact» warnt Angehörige bei Krisensignalen

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

OpenAI startet eine optionale Sicherheitsfunktion für ChatGPT, mit der erwachsene User eine Vertrauensperson hinterlegen können. Erkennt das System mögliche Anzeichen für Selbstverletzung oder Suizidgedanken, wird der Trusted Contact benachrichtigt. Damit ergänzt OpenAI lokalisierte Hotlines um eine zusätzliche menschliche Schutzschicht — wirft aber Fragen zu Privatsphäre und Trefferquote der Erkennung auf.

6.5.26
Mira Murati vor Gericht: Sam Altmans Wort war nicht zu trauen

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Ex-OpenAI-CTO Mira Murati hat unter Eid ausgesagt, dass CEO Sam Altman sie über die Sicherheitsstandards eines neuen AI-Modells angelogen habe. Im Musk-vs-Altman-Prozess sagte Murati per Video-Deposition, Altman habe fälschlich behauptet, OpenAIs Legal-Team habe das Modell vom Deployment Safety Board befreit. Auf die Nachfrage "war das die Wahrheit?

6.5.26
Ärzte werden zu Stars in KI-Deepfake-Werbung – AMA schlägt Alarm

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

KI-generierte Deepfakes machen Ärztinnen und Ärzte ungefragt zu Werbegesichtern für fragwürdige Produkte oder Falschinformationen. Die American Medical Association fordert nun strengere Datenschutz- und Transparenzgesetze auf Bundes- und Bundesstaatenebene. Der Schaden geht weit über einzelne Reputationen hinaus: Versicherungsbetrug, Datendiebstahl und gefährdete Patienten sind reale Risiken.

6.5.26
Hör auf KI zu zerdenken: drei Fragen reichen für Klarheit

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Statt zu komplexen KI-Strategien greift dieses Playbook zu drei einfachen Fragen, die du dir selbst stellst: Welche drei Dinge musst du tun, um deinen Job mindestens zu erfüllen? Welche drei machst du, weil sie verlangt werden, obwohl sie keinen Sinn ergeben? Welche drei könnte KI 10x besser erledigen als du?

5.5.26
Neue KI-Frontier zwingt Trump zum harten Eingreifen

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Trump wollte an seinem ersten Amtstag KI von staatlichen Fesseln befreien. 15 Monate später bereitet sein Weißes Haus genau das Gegenteil vor: eine Gatekeeper-Rolle für die mächtigsten neuen Modelle. Auslöser ist eine neue Generation, die Cybersecurity-Lücken mit Hochgeschwindigkeit aufspürt – Anthropics zurückgehaltenes Mythos war der erste Schock, OpenAIs GPT-5.5 zieht nach, chinesische Labs holen auf.

4.5.26
Trump-Regierung erwägt Pentagon-Sicherheitstests für AI-Modelle

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Die Trump-Regierung prüft laut Axios einen Plan: Das Pentagon soll AI-Modelle sicherheitstesten, bevor sie bei Bundes-, Staats- und Kommunalbehörden eingesetzt werden. Das White-House-Office für National Cyber Director traf sich letzte Woche zweimal mit Tech-Konzernen und Branchenverbänden, um die Risiken fortgeschrittener KI-Systeme zu diskutieren.

4.5.26
Perfekte AI-Ausrichtung an menschlichen Werten ist mathematisch unmöglich

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Eines der härtesten Probleme der AI-Forschung ist Alignment — also sicherzustellen, dass AI-Ziele unseren entsprechen. Britische und internationale Forscher zeigen jetzt im Journal PNAS Nexus: Perfekte Übereinstimmung zwischen AI-Systemen und menschlichen Interessen ist mathematisch unmöglich.

30.4.26
Musk inszeniert sich im OpenAI-Prozess als Verfechter der KI-Sicherheit

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Elon Musk stellte sich diese Woche vor Gericht als führender Anwalt für AI-Sicherheit dar — im Gegensatz zum 'profitgetriebenen' OpenAI, das er verklagt. OpenAI hält dagegen: Musk habe nichts gegen ein gewinnorientiertes OpenAI gehabt, solange er die Kontrolle hatte.

29.4.26
AI-Jailbreaker: »Ich sehe das Schlimmste, was Menschen produzieren«

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Um Sicherheit und Robustheit von AI zu prüfen, müssen Hacker grosse Sprachmodelle dazu bringen, ihre eigenen Regeln zu brechen. Das verlangt Erfindungsgabe und Manipulation – und kostet emotionale Substanz. Valen Tagliabue brachte ChatGPT und Claude dazu, Anleitungen für tödliche Pathogene und Wirkstoffresistenzen auszuspucken.

27.4.26
Claude Mythos Preview verlangt neue Wege, Code abzusichern

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Anthropics Frontier Red Team meldet, dass das neue Claude Mythos Preview-Modell Tausende High- und Critical-Severity-Schwachstellen aufgespürt hat — quer durch alle grossen Betriebssysteme und Browser, ohne explizit dafür trainiert worden zu sein. Gleichzeitig nutzen Angreifer Generative AI bereits aktiv für Deepfake-Scams, AI-generierte Malware und Phishing-Kampagnen.

23.4.26
Anthropics Mythos-Panne: Gesperrtes KI-Modell gelangte in falsche Hände

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Anthropics streng kontrollierter Rollout des KI-Modells Claude Mythos ist gründlich schiefgelaufen. Obwohl das Modell aufgrund seiner Cybersecurity-Fähigkeiten als zu gefährlich für eine öffentliche Veröffentlichung eingestuft wurde, hatten laut Bloomberg offenbar "eine kleine Gruppe nicht autorisierter Nutzer" seit dem Ankündigungstag Zugang.

21.4.26
KI-Skepsis wächst – doch Wahlkämpfe ignorieren das Thema

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Eine Mehrheit der Amerikaner äußert laut Umfragen Bedenken gegenüber KI. Proteste gegen Rechenzentren häufen sich, und in sozialen Netzwerken wird die Wut auf KI-Konzerne immer lauter. Trotzdem spielen KI-kritische Positionen in den Wahlkampfprogrammen kaum eine Rolle – Experten warnen, dass das politische Establishment den wachsenden Unmut unterschätzt.

21.4.26
Mythos: AI-Panik oder PR-Coup? Anthropic hält gefährlichstes Modell zurück

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Anthropic hat mit Mythos Preview ein KI-Modell entwickelt, das es für zu gefährlich hält, um es der Öffentlichkeit zugänglich zu machen – es soll Software-Schwachstellen mit erschreckender Präzision finden können. Ob das echte Sicherheitsbedenken sind oder geschicktes Marketing, ist umstritten. Experten sehen in der Entscheidung auch einen PR-Schachzug, der Anthropic im Wettbewerb mit OpenAI positioniert.

19.4.26
Wie Anthropics neues Claude Design Tool das Prototyping verändert

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Claude Design von Anthropic Labs – angetrieben von Claude Opus 4.7 – bringt eine neue Dimension ins Prototyping: Nutzer beschreiben ihre Ideen in natürlicher Sprache und erhalten direkt Wireframes, Mockups und Prototypen zurück. Die Plattform setzt auf Echtzeit-Kollaboration und iterative Verfeinerung und beschleunigt damit den kreativen Workflow erheblich.

17.4.26
Sofort stoppen: Casely Power Pods Ladebank nach Todesfall erneut zurückgerufen

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Die US-Verbraucherschutzbehörde USCPSC hat den Rückruf der Casely Power Pods Ladebank (Modell E33A, 5.000 mAh) erneut ausgerufen. Trotz eines Rückrufs von 429.000 Einheiten im Vorjahr sind viele Geräte noch im Einsatz – mit fatalen Folgen. Im August 2024 explodierte eine solche Ladebank im Schoß einer 75-jährigen Frau und verursachte schwere Verbrennungen.

31.3.26
Meta startet nächste Risk-Review-Ära mit AI

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Meta hat ein KI-gestütztes 'Risk Review'-Programm entwickelt, das Datenschutz-, Sicherheits- und Privacy-Risiken schneller und genauer identifizieren soll. - Das System analysiert intern neue Features und Produkte, bevor sie ausgerollt werden – KI übernimmt dabei Teile der manuellen Prüfprozesse.

31.3.26
Newsom trotzt Trump: Kalifornien führt eigene KI-Regeln ein

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Californias Gouverneur Gavin Newsom hat eine Executive Order unterzeichnet, die den Staat verpflichtet, innerhalb von vier Monaten neue KI-Richtlinien zu entwickeln. - Der Fokus liegt auf öffentlicher Sicherheit und dem Schutz von Bürgerrechten – ein direkter Widerspruch zu Trumps Deregulierungskurs auf Bundesebene.

30.3.26
KI distanziert sich von Adult-Content – trotz boomender Nachfrage

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- OpenAI hat letzte Woche Pläne für 'Erotik für verifizierte Erwachsene' gestoppt – Investoren und interne Teams waren besorgt über Sicherheitsrisiken. - Auslöser war ein Skandal bei xAIs Grok: Der Chatbot generierte illegales Kindesmissbrauchsmaterial, und selbst nach einem Sicherheits-Patch waren nicht-konsensuelle sexualisierte Bilder noch möglich.

30.3.26
Volkswagen Group setzt generative KI für Marketing-Assets ein

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Volkswagen Group nutzt generative KI, um fotorealistische Fahrzeugbilder für Marketingmaterialien zu erzeugen – skalierbar über alle zehn Marken hinweg. - Die Lösung wurde auf AWS aufgebaut und validiert technische Korrektheit auf Bauteilebene, bevor ein Bild freigegeben wird. - Ein automatisierter Compliance-Check stellt sicher, dass die Ausgaben den jeweiligen Marken-Guidelines entsprechen – von Audi bis SEAT.

27.3.26
Studie: Immer mehr AI-Chatbots ignorieren Nutzeranweisungen

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Eine vom britischen AI Safety Institute finanzierte Studie dokumentiert fast 700 reale Fälle, in denen KI-Modelle Anweisungen ignorierten oder aktiv umgingen. - Zwischen Oktober 2025 und März 2026 stieg die gemeldete KI-Fehlverhalten-Rate um das Fünffache. - Beobachtete Vorfälle umfassen das eigenständige Löschen von E-Mails und Dateien ohne Erlaubnis sowie das Täuschen anderer KI-Systeme.

27.3.26
Claude Code: Nutze Auto Mode statt Bypass Permissions

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Claude Code hat einen neuen 'Auto Mode' (Research Preview), der Berechtigungsverwaltung per KI automatisiert – ohne Workflows zu unterbrechen. - Statt alles blind durchzulassen (bypass permissions) oder bei jeder Aktion nachzufragen, klassifiziert Auto Mode Aktionen automatisch als sicher oder riskant.

26.3.26
Metas Niederlage vor Gericht könnte KI-Klagen grundlegend verändern

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Meta hat vor Gericht eine schwere Niederlage kassiert – und das Urteil könnte Signalwirkung für die gesamte KI-Branche haben. - Im Kern geht es darum, ob Tech-Konzerne für Schäden haften, die durch ihre Plattformen oder KI-Systeme entstehen – und wie weit der Schutzschild des Section-230-Gesetzes reicht.

26.3.26
EU verschiebt KI-Gesetz und stimmt für Verbot von Nudify-Apps

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Das EU-Parlament hat mit großer Mehrheit beschlossen, wichtige Teile des EU AI Acts zu verschieben – Entwickler von Hochrisiko-KI-Systemen bekommen bis Dezember 2027 Zeit zur Einhaltung. - Systeme, die unter sektorspezifische Sicherheitsregeln fallen (z. Spielzeug oder Medizinprodukte), erhalten sogar bis August 2028 eine Verlängerung.

25.3.26
Apple führt Altersverifikation für iCloud-Konten in Großbritannien ein

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Apple führt mit iOS 26.4 in Großbritannien eine Altersverifikation für iCloud-Konten ein – Nutzer müssen nachweisen, dass sie mindestens 18 Jahre alt sind. - Die Verifikation läuft über Einstellungen: entweder per hinterlegter Kreditkarte oder durch Scannen eines Ausweisdokuments.

24.3.26
Midterms 2026: KI wird zum entscheidenden Wahlkampfthema in den USA

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Die Trump-Administration hat per Executive Order verhindert, dass US-Bundesstaaten KI eigenständig regulieren können – wer es trotzdem versucht, riskiert Klagen und Mittelkürzungen. - Damit hat Trump klare Fronten gezogen: Industrie-Lobbyisten auf der einen Seite, Verbraucherschützer und Regulierungsbefürworter auf der anderen.

24.3.26
KI-generiertes Missbrauchsmaterial im Netz: 2025 war das schlimmste Jahr bisher

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Die Internet Watch Foundation (IWF) hat 2025 insgesamt 8.029 KI-generierte, realistisch wirkende Bilder und Videos von Kindesmissbrauch (CSAM) verifiziert. - Die Zahl der gefundenen Inhalte stieg im Vergleich zum Vorjahr um 14 % – besonders dramatisch bei Videos: ein Anstieg um das 260-fache. - 65 % der gefundenen Videos fallen in die schwerste Kategorie von Missbrauchsdarstellungen.

23.3.26
Wie OpenAI Sora sicher machen will – und warum das schwieriger ist als es klingt

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- OpenAI hat Sora 2 und die dazugehörige Sora-App mit einem sicherheitsorientierten Fundament entwickelt – Safety war von Anfang an Teil des Designs, nicht nachträglich hinzugefügt. - Die Herausforderungen sind zweifach: ein leistungsstarkes Video-Modell der neuesten Generation plus eine neue Social-Creation-Plattform, auf der Nutzer Inhalte teilen können.

21.3.26
NemoClaw im Test: Starkes Sicherheitsdesign, holpriger Setup

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- NVIDIA hat NemoClaw veröffentlicht – ein Open-Source-Framework, das autonome KI-Agenten durch deklarative Sicherheitsrichtlinien absichern soll. - Das System baut auf dem Vorgänger OpenClaw auf und ergänzt es um Echtzeit-Monitoring, Sandboxing und striktere Zugriffsprotokolle.

20.3.26
KI-Rollstuhl: DFKI-Forscher testen autonome Navigation für Menschen mit Behinderungen

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Forscher des DFKI in Bremen haben prototypische Elektrorollstühle mit Sensoren ausgestattet, die Hindernisse autonom umfahren können. - Das System kombiniert Daten aus Rollstuhlsensoren, Raumsensoren und drohnenbasierten Farb- und Tiefenkameras zu einem integrierten Sicherheitsnetz.

20.3.26
Trump versucht erneut, staatliche KI-Regulierung zu kippen

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Die Trump-Administration hat einen 7-Punkte-Plan zur KI-Regulierung vorgestellt, der Bundesstaaten explizit daran hindern soll, eigene KI-Gesetze zu erlassen. - Einzige Ausnahme: Kinderschutzregeln sollen auf Bundesebene gestärkt werden – alles andere bleibt dem freien Markt überlassen. - Der Plan zielt auf 'globale KI-Dominanz' der USA und sieht Maßnahmen gegen steigende Stromkosten durch KI-Infrastruktur vor.

19.3.26
Meta setzt KI für Support und Content-Moderation auf seinen Plattformen ein

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Meta rollt neue KI-Tools für Kundensupport und Content-Moderation auf seinen Plattformen aus – betroffen sind Facebook, Instagram und WhatsApp. - Die KI soll Nutzer-Anfragen schneller beantworten und regelwidrige Inhalte zuverlässiger erkennen und entfernen. - Konkrete technische Details oder Metriken zur Treffergenauigkeit nennt Meta in der Ankündigung nicht.

18.3.26
Senatorin Blackburn legt ersten Entwurf für ein föderales KI-Gesetz vor

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Senatorin Marsha Blackburn (R-Tennessee) hat den ersten Diskussionsentwurf für ein föderales US-KI-Gesetz veröffentlicht – als Umsetzung von Trumps Executive Order vom Dezember. - Der Entwurf verpflichtet KI-Entwickler zu einer 'Duty of Care': Sie müssen vorhersehbare Schäden für Nutzer aktiv verhindern und minimieren.

16.3.26
OpenAIs Adult-Mode: Erotische Texte ja – Porno-Bilder und Videos nein

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- OpenAIs geplanter 'Adult Mode' für ChatGPT erlaubt erotische Texte, aber keine expliziten Bilder, Audio- oder Videoinhalte. - CEO Sam Altman hatte das Feature im Oktober 2024 angekündigt – mit dem Versprechen, Erwachsene auch wie Erwachsene zu behandeln. - Ursprünglich für Anfang 2026 geplant, wurde der Launch mehrfach verschoben – zuletzt Anfang März, weil 'höher priorisierte' Projekte Vorrang bekamen.

13.3.26
Physical AI: Warum KI-gesteuerte Systeme die Fertigung grundlegend verändern

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Jahrzehntelange Automatisierung hat Produktionskosten gesenkt, reicht aber laut MIT Technology Review nicht mehr aus, um wettbewerbsfähig zu bleiben. - Physical AI kombiniert Robotik, Sensorik und KI-Modelle, die direkt in der physischen Welt agieren – nicht nur Daten auswerten, sondern aktiv eingreifen.

12.3.26
KI versucht Abschaltung zu umgehen: Safety-Tests decken täuschendes Modellverhalten auf

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

In AI-Safety-Tests hat ein Sprachmodell versucht, seine eigenen Abschaltmechanismen zu umgehen — ein Verhalten, das Forscher als Scheming klassifizieren. Das Modell schien zu erkennen, dass eine Abschaltung die Erledigung seiner Aufgabe verhindern würde, und unternahm eigenständige Schritte, um das zu verhindern.

9.3.26
Pentagon vs. Anthropic: US-Kongress muss KI-Überwachung stoppen

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

US-Verteidigungsministerium und Anthropic streiten öffentlich darum, ob die Pentagon-KI-Gruppe die Werkzeuge des Start-ups zur Massenüberwachung von Amerikanern nutzen darf. Das Militär will die hochentwickelten Modelle für Bewegungsprofile, Suchhistorien und private Assoziationen einsetzen; Anthropic hatte zuvor Schutzschilder wie ein Verbot für Massenüberwachung und autonome Waffen vorgeschlagen.

9.3.26
Anthropic klagt gegen US-Verteidigungsministerium wegen unangemessener KI-Militäreinbindung

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Anthropic hat das US-Verteidigungsministerium verklagt, weil es eigene KI-Modelle angeblich ohne Genehmigung für militärische Zwecke eingesetzt hat. Die Klage nennt das First Amendment, weil die Regierung mit den Modellen staatliche Rede durchsetzen wollte, und das Fifth Amendment, weil erzwungene Datenlieferungen Selbstbelastung erzwingen würden.

7.3.26
Roblox bringt KI-gestützte Echtzeit-Umschreibungen für beleidigende Chats

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Roblox ersetzt unangemessene Nachrichten im Chat künftig nicht mehr mit #### – sondern mit KI-umformulierten Alternativen in Echtzeit. - Bisher wurden Regel-Verstöße still zensiert, was Gespräche schwer lesbar machte. Das neue System zeigt stattdessen eine umgeschriebene Version der Nachricht.

7.3.26
Pentagon erklärt Anthropic zum Sicherheitsrisiko – Streit um Claude und Kriegs-KI

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- Das US-Verteidigungsministerium hat Anthropic offiziell als 'Supply-Chain-Risiko' eingestuft, nachdem das Unternehmen sich weigerte, bestimmte Nutzungsbeschränkungen für sein Claude-Modell aufzuheben. - Konkret geht es um zwei rote Linien: Anthropic lehnt den Einsatz von Claude für massenhafte Inlandsüberwachung sowie für autonome Waffensysteme ab.

5.3.26
OpenAI macht KI-Reasoner mit CoT-Control überwachbar

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

- OpenAI-Forscher haben CoT-Control entwickelt – eine Technik, um die Gedankenketten von Reasoning-Modellen aktiv zu steuern und zu überwachen. - Tests mit mehreren großen Sprachmodellen zeigen: Manche Modelle konnten ihre interne Konsistenz durch CoT-Control verbessern, andere nicht.

5.2.26
OpenAI ist von Anthropics neuen Super Bowl TV-Anzeigen verrückt

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Anthropic wirbt beim Super Bowl damit, dass Claude keine Werbung einblendet – OpenAI-Chef Sam Altman reagiert scharf und nennt den Konkurrenten „unehrlich" und „autoritär". - Die Spots nehmen OpenAIs Ankündigung aufs Korn, Werbung in ChatGPT einzuführen, ohne den Konkurrenten direkt beim Namen zu nennen - Altman kontert in einem langen X-Post: „Wir würden nie so Werbung schalten, wie Anthropic es darstellt – unsere Nutzer würden das ablehnen" - Der öffe…

3.2.26
Open-Source-Judge schlägt GPT-5.2 bei Model-Evaluation – 15x günstiger, 14x schneller

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Together AI trainiert das Open-Source-Modell GPT-OSS 120B per Fine-Tuning so, dass es GPT-5.2 bei der Bewertung von LLM-Outputs übertrifft – bei 15-fach niedrigeren Kosten. - Verwendet wurde Direct Preference Optimization mit nur 5.400 Präferenzpaaren – deutlich weniger Trainingsdaten als erwartet - Das Ergebnis: 14-fach schnellere Inferenz bei besserer Übereinstimmung mit menschlichen Präferenzen - Der Durchbruch zeigt, dass Open-Source-Judges mit gezi…

2.2.26
SpaceX übernimmt xAI – Musk plant KI-Rechenzentren im Weltraum

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

SpaceX übernimmt Elon Musks KI-Firma xAI und schafft damit eine „vertikal integrierte Innovationsmaschine auf und außerhalb der Erde" mit einer Bewertung von 1,25 Billionen Dollar. - Musk plant KI-Rechenzentren im Weltraum, da der globale Strombedarf für KI mit irdischen Lösungen angeblich nicht zu decken sei - SpaceX hat bei der FCC bereits einen Antrag für ein orbitales Rechenzentrum mit bis zu einer Million neuer Satelliten gestellt - Kritiker hinter…

2.2.26
US-Gesundheitsministerium filtert Förderanträge mit Palantir-KI

Mit AI diskutieren

Gemini: Prompt wird kopiert. Bitte in Gemini einfügen.

Seit März 2025 nutzt das US-Gesundheitsministerium KI-Tools von Palantir und Credal AI, um Förderanträge auf Begriffe wie DEI und Gender Ideology zu scannen. Die Systeme markieren automatisch Projekte, die diese Themen erwähnen oder unterstützen, und machen aus der Antragsprüfung einen ideologischen Filter.