Google Books: Künstliche Intelligenz erobert den Index – Was bedeutet das für den Ngram Viewer?

Google Books, die Plattform, die eine riesige Menge an veröffentlichtem Material für Wissenschaftler und Bücherwürmer zugänglich gemacht hat, steht derzeit unter Beschuss. Es scheint, dass Google Books nun auch minderwertige Bücher in seinem Index hat. Das könnte natürlich Auswirkungen auf die Informationsgrundlage des beliebten Sprachverfolgungstools Ngram haben.

Laut einem Bericht von 404Media hat Google Books eine Vielzahl von Büchern, bei denen es sich möglicherweise um Werke handelt, die von Künstlicher Intelligenz (KI) verfasst wurden. Das ist schon faszinierend, oder? Wir leben tatsächlich in einer Zeit, in der KI Bücher schreiben kann. Ein bisschen gruselig, wenn man bedenkt, dass sie uns vielleicht alle irgendwann arbeitslos machen könnte. Aber das ist eine andere Geschichte.

Jedenfalls hat 404Media recherchiert und nach der Phrase “as of my last knowledge update” gesucht. Das ist ein Ausdruck, den Chatbots gerne verwenden, um anzugeben, dass dies der Stand ihres Wissens ist. Und was haben sie gefunden? Viele Bücher! Normalerweise erhält man bei einer solchen Suche schriftliche Werke, die diese Phrasen enthalten. Aber hier war der Haken: Die Mehrheit der Bücher handelte tatsächlich von Künstlicher Intelligenz. Einige von ihnen hatten den Anschein, als wären sie von einem Bot verfasst worden, obwohl sie eigentlich über ganz andere Themen sprachen.

Einige der entdeckten Bücher ähnelten angeblich Werken wie “Tristin McIvers Bears, Bulls, and Wolves: Stock Trading for the Twenty-Year-Old”. Das klingt schon etwas verdächtig, oder? Vielleicht haben diese Bücher Informationen von Wikipedia abgerufen und den Satz “as of my last knowledge update” eingefügt. Andere Bücher handelten von Twitter und enthielten immer noch Informationen aus dem Jahr 2021. Es könnte sein, dass einige KI-Modelle zuletzt Trainingsdaten aus diesem Jahr erhalten haben.

Jetzt stellt sich natürlich die Frage, was hat das mit dem Ngram Viewer zu tun? Nun, der Ngram Viewer ist ein Forschungstool von Google, das hauptsächlich auf den Daten von Google Books basiert. Es verfolgt die Veränderungen in der Sprache im Laufe der Zeit, indem es Informationen aus schriftlichen Werken nutzt. Google Books hat Bücher aus dem 16. Jahrhundert digitalisiert und indexiert, während der Ngram Viewer zuletzt im Jahr 2019 aktualisiert wurde.

Trotz einiger Unvollkommenheiten wird das Tool Ngram von vielen Linguisten und anderen Wissenschaftlern für ihre Forschungszwecke genutzt. Aber was passiert jetzt mit den KI-Büchern in Google Books? Laut 404Media hat Google mitgeteilt, dass aktuelle Werke derzeit nicht in den Ngram-Ergebnissen angezeigt werden. Aber wer weiß, vielleicht werden sie in zukünftigen Datenaktualisierungen berücksichtigt. Es bleibt abzuwarten, wie sich diese Entwicklung auf die Nutzerinnen und Nutzer von Ngram auswirken wird und ob Google Maßnahmen ergreifen wird, um die Qualität der in Google Books indizierten Bücher zu verbessern.

Wir können gespannt sein, wie sich diese Geschichte weiterentwickelt. Werden wir in Zukunft mehr KI-Bücher finden? Wird die KI uns alle arbeitslos machen? Und vor allem, wird Google die Qualität seiner Bücher verbessern? Nur die Zeit wird es zeigen. Bis dahin können wir nur hoffen, dass die KI nicht beschließt, einen Bestseller zu schreiben und uns alle in den Schatten zu stellen. Aber hey, wenn sie es tut, könnte es zumindest ein interessanter Lesestoff sein!

Schlagwörter: Google Books + Ngram Viewer + Ngram

Wie bewerten Sie den Schreibstil des Artikels?
1 Star2 Stars3 Stars4 Stars5 Stars
  • 5. April 2024