Falscher Klitschko narrt Politiker Darum wird es zunehmend schwieriger, Deep Fakes zu erkennen

DPA/dj

27.6.2022 - 11:08

Die Berliner Bürgermeisterin war sich sicher, dass in der Videokonferenz tatsächlich Kiews Bürgermeister Klitschko zu sehen ist. Sie hatte es aber mit einem sogenannten Deep Fake zu tun. Wie funktioniert die Fälschung mit Hilfe der künstlichen Intelligenz?

DPA, DPA/dj

Vielleicht hätte Berlins Regierende Bürgermeisterin Franziska Giffey (SPD) misstrauisch werden sollen, dass ihr Gesprächspartner Vitali Klitschko mitten im Sommer mit dicker Jacke und Pullover zur vereinbarten Videokonferenz erschienen war.

So dauerte es einige Zeit, bis Giffey und ihr Team wegen der merkwürdigen Fragen des vermeintlichen Bürgermeisters von Kiew misstrauisch wurden. «Es gab keine Anhaltspunkte dafür, dass die Videokonferenz nicht mit einer echten Person geführt wird. Allem Anschein nach handelt es sich um Deep Fake», erklärte die Senatskanzlei auf Twitter.

Was ist ein sogenannter Deep Fake?

Damit wird ein Medieninhalt bezeichnet, der mit Techniken künstlicher Intelligenz (KI) manipuliert wurde. Dabei kann es sich beispielsweise um ein vermeintlich authentisches Video oder eine Audio-Aufnahme handeln. Der Begriff «Deep Fake» ist von den Worten «Deep Learning» und «Fake» (Fälschung) abgeleitet.

Deep Learning ist ein Verfahren in der künstlichen Intelligenz, bei dem das System durch eine intensive Beobachtung lernt. Dabei werden Lippenbewegungen, Mimik und Körperhaltung analysiert. Beobachtet wird auch, wie sich eine Person bewegt oder wie sie spricht.

Wie kam der Fake-Klischko in die Videokonferenz?

Für die Auftritte des Fake-Klitschko bei Giffey und dem Wiener Bürgermeister Michael Ludwig (SPÖ) wurde mit hoher Wahrscheinlichkeit Videomaterial eines echten Klitschko-Interviews mit dem ukrainischen Journalisten Dmytro Hordon verwendet. Dabei wurden in Echtzeit die Lippenbewegungen aus dem Video mit den Aussagen desjenigen zusammengeführt, der tatsächlich mit Giffey gesprochen hat.

Seit wann gibt es Deep-Fake-Systeme?

Als wichtiger Moment in der Entwicklung von Systemen, die für solche Videomanipulationen geeignet sind, gilt ein Experiment der University of Washington. 2017 stellten Forscher*innen der Universität Algorithmen vor, die in der Lage waren, beliebige Audioclips in ein realistisches, lippensynchrones Video der Person umzuwandeln. So legten die Wissenschaftler*innen dem ehemaligen US-Präsidenten Barack Obama heikle Aussagen zu Themen wie Terrorismus oder Massenarbeitslosigkeit virtuell in den Mund.

Haben die Forscher damit nicht eine Monster-Technologie geschaffen?

Die Wissenschaftler*innen wollten eigentlich ein System entwickeln, um die Bildqualität bei Videokonferenzen zu verbessern. Da das Streaming von Audio über das Internet weit weniger Bandbreite benötigt als Video, wollte man den Ton nutzen, um daraus ein Video in viel besserer Qualität zu produzieren. Die Wissenschaftler diskutierten damals aber schon die Gefahr, dass diese Technologie missbraucht werden kann.

Braucht man für Deep Fakes einen Supercomputer?

In den App-Stores gibt es etliche Anwendungen, die eigentlich dazu dienen sollen, Selfies zu optimieren oder Porträts zu retuschieren. Doch diese Apps ermöglichen es auch, in Videos die Gesichter auszutauschen. Andere Programme wandeln Fotos in animierte Videos um. Bei der Bildqualität stossen diese Apps jedoch schnell an Grenzen. Für ausgeklügelte Deep-Fake-Attacken auf Politiker*innen benötigt man derzeit noch leistungsfähige Rechner.

Setzen Kriminelle Deep-Fake-Technik ein?

Ja. Zum einen kann die Technik für böswillige Fake-Videos missbraucht werden, mit denen sich die Täter*innen strafbar machen. Dazu gehören gefälschte Sex-Videos, bei denen das Gesicht des Opfers in Pornos eingebaut wird. Deep Fakes werden aber auch beispielsweise von Kriminellen verwendet, um betrügerische Geldüberweisungen zu veranlassen. Beim Chef-Betrug erhält beispielsweise ein Buchhalter einer Firma eine manipulierte Sprachnotiz seiner Chefin, in der sie eine Überweisung auf ein bestimmtes Bankkonto anordnet. Der Absender ist wie die Audioaufnahme gefälscht.

Die Technik der Videomanipulation wird aber auch von Strafverfolgungsbehörden verwendet. So hat die niederländische Polizei in diesem Frühjahr einen Teenager fast 20 Jahre nach dessen gewaltsamem Tod in einem Video digital zum Leben erweckt – und daraufhin Dutzende Hinweise erhalten.

Wer steht hinter dem Klitschko-Fake?

Der Gesprächsverlauf legt die Vermutung nahe, dass dahinter pro-russische Kräfte stecken. Allerdings kann eine Zuordnung derzeit nicht zweifelsfrei vorgenommen werden, auch weil die wahren Täter*innen oft Spuren hinterlassen, die bewusst in die falsche Richtung zeigen. Denkbar ist beispielsweise auch, dass eine politische Spassguerilla die Politiker*innen in Misskredit bringen will.

Wie kann man Deep Fakes erkennen?

Das wird immer schwerer fallen. Die Algorithmen der künstlichen Intelligenz und die verwendeten Hardware-Systeme werden künftig in der Lage sein, gefälschtes Videomaterial zu produzieren, das absolut authentisch aussieht. Man wird also seinen Augen und Ohren allein nicht mehr unbedingt vertrauen können.

Um so wichtiger ist es, mit Logik und gesundem Menschenverstand aufsehenerregende Videoclips in Frage zu stellen. Bei einer völlig überraschenden Entwicklung oder weitreichenden Aussage sollten sich Nutzerinnen und Nutzer stets fragen: Wie wahrscheinlich ist es, dass sie auf diese Weise verbreitet wird? Manchmal kann auch künstliche Intelligenz bei der Entdeckung von Fake-KI helfen: So kann man auf der Website deepware.ai Videos oder Links zu Videos hochladen, um eine Einschätzung zu erhalten, ob es sich dabei um Deep Fakes handelt.