{"id":7501,"date":"2024-05-08T12:09:03","date_gmt":"2024-05-08T12:09:03","guid":{"rendered":"https:\/\/byte-bucket.com\/2024\/05\/08\/openai-on-a-mission-vom-altmodischen-robots-txt-zur-futuristischen-media-manager-loesung\/"},"modified":"2024-05-08T12:09:03","modified_gmt":"2024-05-08T12:09:03","slug":"openai-on-a-mission-vom-altmodischen-robots-txt-zur-futuristischen-media-manager-loesung","status":"publish","type":"post","link":"https:\/\/byte-bucket.com\/?p=7501","title":{"rendered":"OpenAI on a Mission: Vom altmodischen robots.txt zur futuristischen Media Manager L\u00f6sung"},"content":{"rendered":"<p>OpenAI hat gro\u00dfe Pl\u00e4ne, um den Zugang von Crawlern zu Websites zu regeln. Statt der altbew\u00e4hrten robots.txt-Datei soll der Media Manager zum Einsatz kommen. Klingt fancy, oder? Das Unternehmen hat sich zum Ziel gesetzt, ihre Version bis 2025 einsatzbereit zu haben. <\/p>\n<p>Aber warum diese Ver\u00e4nderung? Nun, die bisherige Regelung hatte ihre Schw\u00e4chen. Um Crawler von einer Website fernzuhalten, mussten sie explizit ausgeschlossen werden. Das war bisher noch kein allzu gro\u00dfes Problem, aber mit der fortschreitenden KI-Technologie und dem wachsenden Bedarf an Trainingsmaterial hat sich die Situation ge\u00e4ndert. Immer mehr Verlage und Urheber m\u00f6chten nicht, dass ihre Inhalte zur Schulung von KI-Modellen verwendet werden. <\/p>\n<p>Fr\u00fcher konnte man bekannte Crawler einfach ausschlie\u00dfen und gut war&#8217;s. Doch jetzt tauchen t\u00e4glich neue Crawler auf, was Webseitenbetreibern Kopfschmerzen bereitet. Es ist schwierig, immer auf dem aktuellen Stand zu sein. Eine einfache Textnachricht auf der Webseite reicht oft nicht aus, um die Nutzung der Inhalte zu untersagen. Gleichzeitig m\u00f6chten die Webseitenbetreiber aber auch bei Google gut auffindbar sein. Das Problem dabei ist, dass Google die Nutzung von Inhalten f\u00fcr die Suche auch f\u00fcr das Training von KI-Modellen erlaubt. <\/p>\n<p>Ein echtes Dilemma also. Aber OpenAI hat einen Vorschlag: Das gesamte System soll ge\u00e4ndert werden. Der Media Manager soll den Erstellern von Inhalten die M\u00f6glichkeit geben, festzulegen, wie ihre Inhalte behandelt werden sollen. Klingt gut, oder? Das Ganze soll durch den Einsatz von Machine Learning geschehen. Die genaue Umsetzung ist jedoch noch ziemlich unklar.<\/p>\n<p>In einem Blogpost betont OpenAI, dass ihre KI-Dienste allen Menschen helfen sollen, einschlie\u00dflich der Urheber. Das klingt doch sympathisch. Es gibt allerdings auch Vorw\u00fcrfe des Diebstahls von urheberrechtlich gesch\u00fctztem Material, das ohne Erlaubnis in die Schulung der KI-Modelle eingeflossen ist. OpenAI betont jedoch, dass sie keine Datenbank sind und dass KI-Modelle Lernmaschinen sind, die Inhalte verarbeiten, aber nicht speichern und reproduzieren. <\/p>\n<p>OpenAI betont au\u00dferdem, dass die Verlinkung zu Quellen den ChatGPT-Publishern dabei helfen w\u00fcrde, eine direkte Verbindung zu ihren Lesern herzustellen. Das ist sicherlich von Vorteil. Allerdings wird nicht erw\u00e4hnt, dass potenzielle Leser bereits die Antwort aus einem Artikel kopieren k\u00f6nnen, ohne die Webseite des Verlags zu besuchen. Ups!<\/p>\n<p>Und was ist mit der Verg\u00fctung der Content-Ersteller? OpenAI verweist auf Vereinbarungen mit Verlagen wie Axel Springer, der Financial Times und Le Monde. Klingt nach einem guten Anfang, aber es ist unwahrscheinlich, dass solche Vereinbarungen mit allen Verlagen und Urhebern getroffen werden k\u00f6nnen. Das k\u00f6nnte unter dem Digital Markets Act (DMA) als unzul\u00e4ssiger Wettbewerbsvorteil angesehen werden. Ups, nochmal! <\/p>\n<p>Also, OpenAI hat da einiges vor. Ob ihre Pl\u00e4ne letztendlich aufgehen und alle zufriedenstellen k\u00f6nnen, wird sich zeigen. Bis dahin halten wir gespannt die Augen offen und hoffen auf eine bessere Regelung f\u00fcr den Zugang zu Online-Inhalten.<\/p>\n<p>Schlagw\u00f6rter: OpenAI + Google + ChatGPT<\/p>\n","protected":false},"excerpt":{"rendered":"<p>OpenAI hat gro\u00dfe Pl\u00e4ne, um den Zugang von Crawlern zu Websites zu regeln. Statt der altbew\u00e4hrten robots.txt-Datei soll der Media Manager zum Einsatz kommen. Klingt fancy, oder? Das Unternehmen hat sich zum Ziel gesetzt, ihre Version bis 2025 einsatzbereit zu haben. Aber warum diese Ver\u00e4nderung? Nun, die bisherige Regelung hatte&#46;&#46;&#46;<\/p>\n","protected":false},"author":4,"featured_media":7500,"comment_status":"","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-7501","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/7501","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=7501"}],"version-history":[{"count":0,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/7501\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/media\/7500"}],"wp:attachment":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=7501"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=7501"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=7501"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}