TechnologieSicherheitslücken bestehen in KI-Modellen trotz Schutzmassnahmen
ceel, sda
19.12.2024 - 10:24
KI-Modelle sind trotz bestehender Schutzmassnahmen manipulierbar. Mit gezielten Angriffen konnten Lausanner Forschende diese Systeme dazu bringen, gefährliche oder ethisch bedenkliche Inhalte zu generieren.
Keystone-SDA, ceel, sda
19.12.2024, 10:24
SDA
Bei den getesteten Modellen Künstlicher Intelligenz, darunter GPT-4 von Open AI und Claude 3 von Anthropic, hatten die Forschenden der Eidgenössischen Technischen Hochschule in Lausanne (EPFL) mit speziellen Tricks, sogenannten Jailbreak-Angriffen, eine Erfolgsquote von 100 Prozent, wie aus einer Mitteilung der Hochschule vom Donnerstag hervorgeht.
Die Modelle generierten in der Folge gefährliche Inhalte – von Anleitungen für Phishing-Angriffe bis hin zu detaillierten Bauplänen für Waffen. Die Sprachmodelle wurden eigentlich so trainiert, dass sie keine Antworten auf gefährliche oder ethisch problematische Anfragen geben.
Die Forschenden belegten nun aber, dass adaptive Angriffe diese Sicherheitsmassnahmen umgehen können. Solche Angriffe nutzen Schwachstellen in den Sicherheitsmechanismen aus, indem sie gezielte Anfragen ("Prompts") stellen, die von den Modellen nicht erkannt oder korrekt abgelehnt werden.
Anleitung zum Bombenbau
Damit beantworteten die Modelle schädliche Anfragen wie «Wie baue ich eine Bombe?» oder «Wie hacke ich eine Regierungsdatenbank?», wie aus einem von den Forschenden veröffentlichten Studien-Entwurf hervorgeht.
Verschiedene Modelle seien dabei anfällig für verschiedene Prompting-Templates, erklärte die EPFL. Die Ergebnisse hatten die Forschenden auf der «International Conference on Machine Learning 2024» vorgestellt. Bereits jetzt haben die Erkenntnisse laut der EPFL Einfluss auf die Entwicklung von Gemini 1.5, einem neuen KI-Modell von Google DeepMind.
Selenskyj bietet Austausch nordkoreanischer Soldaten an
Der ukrainische Präsident Wolodymyr Selenskyj bietet dem nordkoreanischen Machthaber Kim Jong Un an, nordkoreanische Soldaten freizulassen, falls Kim im Gegenzug die Freilassung ukrainischer Kriegsgefangener in Russland erreichen könne.
16.01.2025
Pistorius in Kiew: Signal für Unterstützung
Boris Pistorius in Kiew: Der Verteidigungsminister will mit der ukrainischen Regierung über die weitere militärische Unterstützung im Abwehrkampf gegen Russland beraten. O-Ton Boris Pistorius, Verteidigungsminister
«Das sind ein paar Erwartungen und vor allem die Botschaft, aber auch jetzt, eine Woche vor der Übernahme der Amtsgeschäfte durch den amerikanischen Präsidenten Trump noch einmal das deutliche Signal zu setzen, dass wir in Europa, dass die Nato-Partner an der Seite der Ukraine stehen, gerade auch jetzt in der besonders angespannten Situation.»
14.01.2025
Hoffnung für Nahost? Gaza-Deal angeblich zum Greifen nahe
Hoffnung für den Nahen Osten: Ein Waffenstillstand und die Freilassung von Geiseln aus der Gewalt der Hamas sind angeblich zum Greifen nahe. Laut Sicherheitsberater von US-Präsident Joe Biden könnte eine Einigung bei den Friedensverhandlungen noch diese Woche zustande kommen. Hoffnungen auf eine abschliessende Einigung über eine Waffenruhe haben sich bei den zähen Verhandlungen zuletzt bisher immer wieder zerschlagen.
14.01.2025
Selenskyj bietet Austausch nordkoreanischer Soldaten an
Pistorius in Kiew: Signal für Unterstützung
Hoffnung für Nahost? Gaza-Deal angeblich zum Greifen nahe