OpenAI hat große Pläne, um den Zugang von Crawlern zu Websites zu regeln. Statt der altbewährten robots.txt-Datei soll der Media Manager zum Einsatz kommen. Klingt fancy, oder? Das Unternehmen hat sich zum Ziel gesetzt, ihre Version bis 2025 einsatzbereit zu haben.
Aber warum diese Veränderung? Nun, die bisherige Regelung hatte ihre Schwächen. Um Crawler von einer Website fernzuhalten, mussten sie explizit ausgeschlossen werden. Das war bisher noch kein allzu großes Problem, aber mit der fortschreitenden KI-Technologie und dem wachsenden Bedarf an Trainingsmaterial hat sich die Situation geändert. Immer mehr Verlage und Urheber möchten nicht, dass ihre Inhalte zur Schulung von KI-Modellen verwendet werden.
Früher konnte man bekannte Crawler einfach ausschließen und gut war’s. Doch jetzt tauchen täglich neue Crawler auf, was Webseitenbetreibern Kopfschmerzen bereitet. Es ist schwierig, immer auf dem aktuellen Stand zu sein. Eine einfache Textnachricht auf der Webseite reicht oft nicht aus, um die Nutzung der Inhalte zu untersagen. Gleichzeitig möchten die Webseitenbetreiber aber auch bei Google gut auffindbar sein. Das Problem dabei ist, dass Google die Nutzung von Inhalten für die Suche auch für das Training von KI-Modellen erlaubt.
Ein echtes Dilemma also. Aber OpenAI hat einen Vorschlag: Das gesamte System soll geändert werden. Der Media Manager soll den Erstellern von Inhalten die Möglichkeit geben, festzulegen, wie ihre Inhalte behandelt werden sollen. Klingt gut, oder? Das Ganze soll durch den Einsatz von Machine Learning geschehen. Die genaue Umsetzung ist jedoch noch ziemlich unklar.
In einem Blogpost betont OpenAI, dass ihre KI-Dienste allen Menschen helfen sollen, einschließlich der Urheber. Das klingt doch sympathisch. Es gibt allerdings auch Vorwürfe des Diebstahls von urheberrechtlich geschütztem Material, das ohne Erlaubnis in die Schulung der KI-Modelle eingeflossen ist. OpenAI betont jedoch, dass sie keine Datenbank sind und dass KI-Modelle Lernmaschinen sind, die Inhalte verarbeiten, aber nicht speichern und reproduzieren.
OpenAI betont außerdem, dass die Verlinkung zu Quellen den ChatGPT-Publishern dabei helfen würde, eine direkte Verbindung zu ihren Lesern herzustellen. Das ist sicherlich von Vorteil. Allerdings wird nicht erwähnt, dass potenzielle Leser bereits die Antwort aus einem Artikel kopieren können, ohne die Webseite des Verlags zu besuchen. Ups!
Und was ist mit der Vergütung der Content-Ersteller? OpenAI verweist auf Vereinbarungen mit Verlagen wie Axel Springer, der Financial Times und Le Monde. Klingt nach einem guten Anfang, aber es ist unwahrscheinlich, dass solche Vereinbarungen mit allen Verlagen und Urhebern getroffen werden können. Das könnte unter dem Digital Markets Act (DMA) als unzulässiger Wettbewerbsvorteil angesehen werden. Ups, nochmal!
Also, OpenAI hat da einiges vor. Ob ihre Pläne letztendlich aufgehen und alle zufriedenstellen können, wird sich zeigen. Bis dahin halten wir gespannt die Augen offen und hoffen auf eine bessere Regelung für den Zugang zu Online-Inhalten.
Schlagwörter: OpenAI + Google + ChatGPT
Wie bewerten Sie den Schreibstil des Artikels?
