{"id":16259,"date":"2026-04-09T10:11:41","date_gmt":"2026-04-09T10:11:41","guid":{"rendered":"https:\/\/byte-bucket.com\/2026\/04\/09\/new-york-times-und-oumi-enthuellen-googles-ki-antworten-haben-haken-und-oesen\/"},"modified":"2026-04-09T10:11:41","modified_gmt":"2026-04-09T10:11:41","slug":"new-york-times-und-oumi-enthuellen-googles-ki-antworten-haben-haken-und-oesen","status":"publish","type":"post","link":"https:\/\/byte-bucket.com\/?p=16259","title":{"rendered":"New York Times und Oumi enth\u00fcllen: Googles KI-Antworten haben Haken und \u00d6sen"},"content":{"rendered":"<p>Die New York Times hat gemeinsam mit dem KI-Startup Oumi ein tiefgreifendes Untersuchungsprojekt zu den Aussagen in Googles KI-basierten \u00dcbersichten gestartet. Das Ergebnis: In neun von zehn F\u00e4llen sind die Antworten korrekt, doch bei einer gewaltigen Datenmenge wie Googles \u00fcber 5 Billionen Suchanfragen pro Jahr summiert sich dies zu Hunderttausenden Fehlern pro Minute. Die Frage nach der Genauigkeit von KI-Antworten ist komplex und vielschichtig. Zum einen sind diese Antworten nicht deterministisch. Stellt man dieselbe Frage zweimal innerhalb k\u00fcrzester Zeit, erh\u00e4lt man m\u00f6glicherweise zwei unterschiedliche Antworten, wobei nur eine korrekt ist \u2013 die andere fehlerhaft. Hinzu kommt, dass auch die Bewertung der Korrektheit durch menschliche Tester oft auf KI-Systeme angewiesen ist, die selbst Fehlerquellen bergen k\u00f6nnen. <\/p>\n<p>F\u00fcr diese Untersuchung wurde ein weit verbreitetes Benchmark namens SimpleQA herangezogen, das jedoch selbst Fehler beinhaltet, was Google in seiner Kritik hervorhebt. Die New York Times testete Googles Antworten zweimal: Erstens im Februar, damals noch basierend auf der KI-Architektur Gemini 2, und zweitens im Oktober nach dessen Upgrade auf Gemini 3. Dabei verbesserte sich die Genauigkeit von 85 Prozent auf respektable 91 Prozent. Die Fehlerursachen waren vielf\u00e4ltig. Manchmal verkn\u00fcpfte die KI Webseiten, die die Behauptungen gar nicht unterst\u00fctzten. Oft waren die Fakten auf den verlinkten Seiten selbst falsch oder die KI zog aus korrekt dargestellten Fakten falsche Schl\u00fcsse. In einigen F\u00e4llen wurden Fakten zwar korrekt wiedergegeben, aber zus\u00e4tzliche Informationen waren fehlerhaft. Es gab sogar F\u00e4lle, in denen die KI auf mutwillig im Internet verbreitete Falschinformationen hereingefallen ist. <\/p>\n<p>Dieses Projekt unterstreicht eindr\u00fccklich, dass KI-Antworten nicht unfehlbar sind und stets einer kritischen \u00dcberpr\u00fcfung bed\u00fcrfen. Niemandem sollte man ungepr\u00fcft blind vertrauen \u2013 eine doppelte Pr\u00fcfung ist unerl\u00e4sslich, um die Richtigkeit von Informationen aus dieser Quelle sicherzustellen.<\/p>\n<p>Schlagw\u00f6rter: Googles + New York Times + Gemini<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Die New York Times hat gemeinsam mit dem KI-Startup Oumi ein tiefgreifendes Untersuchungsprojekt zu den Aussagen in Googles KI-basierten \u00dcbersichten gestartet. Das Ergebnis: In neun von zehn F\u00e4llen sind die Antworten korrekt, doch bei einer gewaltigen Datenmenge wie Googles \u00fcber 5 Billionen Suchanfragen pro Jahr summiert sich dies zu Hunderttausenden&#46;&#46;&#46;<\/p>\n","protected":false},"author":4,"featured_media":16258,"comment_status":"","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-16259","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/16259","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=16259"}],"version-history":[{"count":0,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/16259\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/media\/16258"}],"wp:attachment":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=16259"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=16259"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=16259"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}