USA diskutieren Offenlegung von Trainingsdaten für KI-Modelle: Neues Gesetz zur Registrierung des Urheberrechts geplant

Die Offenlegung von Trainingsdaten für KI-Modelle ist ein heiß diskutiertes Thema, das nun auch in den USA zu einer neuen Gesetzesvorlage geführt hat. Der demokratische Politiker Adam Schiff aus Kalifornien ist der Initiator dieses Vorhabens, das den Namen „Generative KI Urheberrecht Offenlegungs-Gesetz“ trägt.

Die Idee hinter diesem Gesetz ist es, sämtliche Trainingsdatensätze, die für das Training von KI-Modellen verwendet werden, offenzulegen. Diese Daten sollen einer Behörde zur Registrierung des Urheberrechts vorgelegt werden. Dadurch sollen nicht nur die KI-Anbieter selbst, sondern auch die Anbieter von Datensätzen, die Material aus dem Internet sammeln oder von bestimmten Quellen beziehen, betroffen sein.

Gemäß der Gesetzesvorlage müssen alle Quellen eines Datensatzes, sofern vorhanden, zusammen mit der dazugehörigen URL an die zuständige Behörde übermittelt werden. Jegliche Änderungen müssen ebenfalls gemeldet werden. Die Anbieter haben die Pflicht, diese Liste spätestens 30 Tage vor der Veröffentlichung eines KI-Modells vorzulegen.

Es ist jedoch wichtig zu beachten, dass bereits auf dem Markt vorhandene KI-Modelle von diesem Gesetz nicht betroffen sind, sofern keine Modifikationen vorgenommen werden. Das bedeutet, dass Modelle wie ChatGPT weiterhin bestehen können, ohne dass sie die Trainingsdaten offenlegen müssen.

Trotzdem sieht sich das Unternehmen OpenAI mit einer Klage der New York Times konfrontiert. Der Zeitung wird vorgeworfen, urheberrechtlich geschütztes Material unzulässigerweise verwendet zu haben. Die New York Times fordert hohe Zahlungen und möglicherweise die Löschung der betroffenen Daten. OpenAI hat bereits Millionen an andere Verlage gezahlt, um Zugriff auf deren Archive zu erhalten.

Die Gesetzesvorlage von Adam Schiff erfüllt die Erwartungen vieler Autoren, Musiker, Maler, Fotografen, Künstler und Kreativer, die die Nutzung ihrer Werke durch KI-Unternehmen kritisieren. Es gibt jedoch noch rechtliche Unsicherheiten darüber, ob die Verwendung der Daten das Urheberrecht betrifft.

Es gibt unterschiedliche Meinungen zu diesem Thema. Einige argumentieren, dass beim Training ähnliche Methoden wie bei der Google-Suche angewendet werden, bei denen das maschinelle Auslesen erlaubt ist und die Daten nicht an anderer Stelle gespeichert werden. Andere sind der Ansicht, dass sowohl die Verwendung der Daten für das Training als auch die erzeugten Ergebnisse Urheberrechtsverletzungen darstellen können. Ein Beispiel dafür ist die New York Times, die erklärt, dass ChatGPT ganze kostenpflichtige Artikel wiedergegeben hat.

Die Gesetzesvorlage aus Kalifornien findet Zustimmung bei verschiedenen Organisationen und Vereinigungen, die das Urheberrecht vertreten. Bereits unter Joe Biden wurde ein Erlass erlassen, der die Entwickler dazu verpflichtet, ihre KI-Modelle vor der Veröffentlichung zu testen und die Ergebnisse den Behörden mitzuteilen. Dies gilt zumindest für Systeme, die potenziell eine Bedrohung für die nationale Sicherheit, die Wirtschaft oder die öffentliche Gesundheit darstellen können.

Nun wurde ein weiterer Erlass erlassen, der die Verwendung von KI-Tools direkt in den Behörden regelt. Die Behörden haben die Aufgabe, Lösungsansätze zu entwickeln, um Vorurteile in Algorithmen zu verringern. Zudem müssen sie sicherstellen, dass die von ihnen genutzten KI-Systeme weder die Rechte noch die Sicherheit der Bürger der Vereinigten Staaten gefährden.

Es bleibt abzuwarten, wie sich die Gesetzesvorlage entwickelt und ob sie tatsächlich in Kraft treten wird. Die Offenlegung von Trainingsdaten für KI-Modelle ist zweifellos ein wichtiger Schritt, um die Rechte der Urheber zu schützen und die Verwendung von KI-Technologien verantwortungsvoll zu gestalten.

Schlagwörter: ChatGPT + USA + Kalifornien

Wie bewerten Sie den Schreibstil des Artikels?
1 Star2 Stars3 Stars4 Stars5 Stars
  • 11. April 2024