In einem spannenden Vortrag auf der Conference on Computer Vision and Pattern Recognition (CVPR 2025) in Nashville, Tennessee, stellten Forscher der Ruhr-Universität Bochum alarmierende Sicherheitslücken im Bereich der KI-generierten Bilder öffentlich dar. Das Thema Wasserzeichen, die bisher als zuverlässige Kennzeichnung für KI-Erzeugnisse galten, stand im Fokus dieses Vortrags. Die zunehmende Realitätsnähe von Bildern, die mittels künstlicher Intelligenz generiert werden, macht es zunehmend schwierig, sie von echten Fotos zu unterscheiden. Um dieser Herausforderung entgegenzuwirken, wurden Wasserzeichen eingeführt – ein digitaler Stempel, der den Ursprung des Bildes als KI-Generierung signalisiert.
Die Bochumer Forscher demonstrierten jedoch, dass sich diese Wasserzeichen leichter manipulieren lassen, als bisher angenommen. Sie präsentierten zwei neue Angriffe, die die bestehende Sicherheitsarchitektur untergraben. Die erste Methode, die sogenannte Imprinting-Attack, ermöglicht es, das Wasserzeichen eines KI-Bildes auf ein echtes Foto zu übertragen. Dadurch erhält das reale Foto quasi einen digitalen Fake-Stempel und wirkt somit, als wäre es selbst via KI generiert. Der zweite Angriff, der Reprompting-Angriff, nutzt die Funktionsweise von neuronalen Netzen aus. Ein mit Wasserzeichen versehenes Bild wird zurück in den latenten Raum des Modells geschickt – eine Art digitale Zwischenebene – und anschließend mit einem neuen Prompt regeneriert. Aus dieser Regeneration entstehen völlig neue Bilder, die trotzdem das ursprüngliche Wasserzeichen tragen. Beunruhigend an beiden Angriffen ist, dass sie nur ein einziges Referenzbild benötigen, das das Zielwasserzeichen enthält, um ihre Funktionsweise zu vollziehen.
Die modellübergreifende Flexibilität der Angriffe macht sie besonders gefährlich: Sie funktionieren sowohl auf älteren Modellen wie UNet als auch auf den neuesten diffusion-basierten Systemen. Diese Angriffe untergraben somit nicht nur einzelne Systeme, sondern stellen ein grundlegendes Risiko für die gesamte KI-Bildgenerierung dar. Die Frage nach einer zuverlässigen Kennzeichnung von KI-Bildern stellt sich neu. Der bisherige Ansatz mit semantischen Wasserzeichen muss dringend überdacht und verbessert werden, um zukünftig Vertrauen in die Authentizität von Bildern aus dem digitalen Raum zu gewährleisten.
Schlagwörter: CVPR + Nashville + Tennessee
Wie bewerten Sie den Schreibstil des Artikels?
