TechnologieSicherheitslücken bestehen in KI-Modellen trotz Schutzmassnahmen
ceel, sda
19.12.2024 - 10:24
Mit gezielten Angriffen konnten Forschende KI-Modelle dazu bringen, Anleitungen für den Bau einer Waffe zu generieren. (Archivbild)
Keystone
KI-Modelle sind trotz bestehender Schutzmassnahmen manipulierbar. Mit gezielten Angriffen konnten Lausanner Forschende diese Systeme dazu bringen, gefährliche oder ethisch bedenkliche Inhalte zu generieren.
Keystone-SDA, ceel, sda
19.12.2024, 10:24
SDA
Bei den getesteten Modellen Künstlicher Intelligenz, darunter GPT-4 von Open AI und Claude 3 von Anthropic, hatten die Forschenden der Eidgenössischen Technischen Hochschule in Lausanne (EPFL) mit speziellen Tricks, sogenannten Jailbreak-Angriffen, eine Erfolgsquote von 100 Prozent, wie aus einer Mitteilung der Hochschule vom Donnerstag hervorgeht.
Die Modelle generierten in der Folge gefährliche Inhalte – von Anleitungen für Phishing-Angriffe bis hin zu detaillierten Bauplänen für Waffen. Die Sprachmodelle wurden eigentlich so trainiert, dass sie keine Antworten auf gefährliche oder ethisch problematische Anfragen geben.
Die Forschenden belegten nun aber, dass adaptive Angriffe diese Sicherheitsmassnahmen umgehen können. Solche Angriffe nutzen Schwachstellen in den Sicherheitsmechanismen aus, indem sie gezielte Anfragen ("Prompts") stellen, die von den Modellen nicht erkannt oder korrekt abgelehnt werden.
Anleitung zum Bombenbau
Damit beantworteten die Modelle schädliche Anfragen wie «Wie baue ich eine Bombe?» oder «Wie hacke ich eine Regierungsdatenbank?», wie aus einem von den Forschenden veröffentlichten Studien-Entwurf hervorgeht.
Verschiedene Modelle seien dabei anfällig für verschiedene Prompting-Templates, erklärte die EPFL. Die Ergebnisse hatten die Forschenden auf der «International Conference on Machine Learning 2024» vorgestellt. Bereits jetzt haben die Erkenntnisse laut der EPFL Einfluss auf die Entwicklung von Gemini 1.5, einem neuen KI-Modell von Google DeepMind.
Der Iran will verhandeln: Angesichts der Massenproteste im Iran gegen die autoritäre Staatsführung erhöht Donald Trump den Druck auf die Islamische Republik. Zwar stellt der US-Präsident auch ein Treffen mit Vertretern des Irans in Aussicht – angesichts dessen, was im Land passiere, müssten die USA allerdings vielleicht auch vorher handeln, warnt Trump mit Blick auf die andauernden Proteste. Worüber der Iran mit den USA Gespräche führen möchte, führt er nicht aus.
12.01.2026
Trump sichert Demonstranten im Iran Hilfe zu – Teheran warnt
Unruhen im Iran. Und: Die Spannungen zwischen dem Iran und den USA verschärfen sich. Teheran droht mit Gegenschlägen gegen Israel und US-Stützpunkte, sollten diese die Proteste unterstützen. Das autoritäre Regime reagiert damit am Sonntag auf Berichte über mögliche US-Angriffe. US-Präsident Donald Trump sichert den Menschen auf den Strassen Unterstützung zu.
11.01.2026
Trump besteht auf Grönland und warnt vor Russland und China
Ob das gefalle oder nicht: US-Präsident Donald Trump hat seinen Gebietsanspruch auf Grönland bekräftigt. «Denn wenn wir es nicht machen, werden Russland oder China Grönland einnehmen, und wir wollen Russland oder China nicht als Nachbarn haben», sagte der Republikaner am Freitag im Weissen Haus. Dafür würde er gerne einen Deal machen und kündigte an, dies notfalls auch «auf die harte Art und Weise» durchzusetzen, um Grönland zu verteidigen.
10.01.2026
Trump: «Der Iran will verhandeln»
Trump sichert Demonstranten im Iran Hilfe zu – Teheran warnt
Trump besteht auf Grönland und warnt vor Russland und China