{"id":89339,"date":"2026-04-07T19:15:11","date_gmt":"2026-04-07T19:15:11","guid":{"rendered":"https:\/\/www.europesays.com\/at\/89339\/"},"modified":"2026-04-07T19:15:11","modified_gmt":"2026-04-07T19:15:11","slug":"googles-ki-suche-liegt-laut-analyse-in-neun-von-zehn-faellen-richtig","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/at\/89339\/","title":{"rendered":"Googles KI-Suche liegt laut Analyse in neun von zehn F\u00e4llen richtig"},"content":{"rendered":"<p>&#8222;KI kann Fehler machen, bitte Antworten \u00fcberpr\u00fcfen&#8220; steht unter jeder KI-generierten Suchantwort von Google. Doch wie h\u00e4ufig diese Fehler tats\u00e4chlich auftreten, wurde bisher kaum systematisch untersucht.<\/p>\n<p>Das KI-Start-up Oumi hat <a target=\"_blank\" rel=\"noopener nofollow\" href=\"https:\/\/www.nytimes.com\/2026\/04\/07\/technology\/google-ai-overviews-accuracy.html\">im Auftrag der New York Times<\/a> insgesamt 4326 Google-Suchen mit dem branchenweit genutzten SimpleQA-Benchmark untersucht. Getestet wurde in zwei Durchg\u00e4ngen: einmal im Oktober mit Gemini 2 als zugrunde liegender KI-Technologie, einmal im Februar nach dem Upgrade auf Gemini 3.<\/p>\n<p>Das Ergebnis: Mit Gemini 2 waren die AI-Overviews in 85 Prozent der F\u00e4lle korrekt, mit Gemini 3 stieg die Quote auf 91 Prozent. Das klingt nach einer hohen Erfolgsrate, allerdings bedeutet das bei Googles Skalierung auch viele Millionen Falschinformationen pro Stunde.<\/p>\n<p>Was die Studie allerdings nicht beantwortet: W\u00e4ren \u00fcber herk\u00f6mmliche Suchergebnisse oder andere Informationswege bessere Antworten bei den Nutzern angekommen? Nicht alles, was auf Webseiten steht, ist automatisch richtig. Die entscheidende Metrik ist weniger die absolute Korrektheit der KI-Antworten, sondern ob insgesamt mehr richtige Informationen bei Nutzern landen als ohne sie.<\/p>\n<p>Bessere Antworten, schlechtere Nachpr\u00fcfbarkeit<\/p>\n<p>Ein weiteres Ergebnis der Analyse: Obwohl die Genauigkeit mit Gemini 3 gestiegen ist, hat sich die Nachpr\u00fcfbarkeit der Antworten verschlechtert. Oumi untersuchte, ob die von Google verlinkten Quellen die gegebene Antwort tats\u00e4chlich st\u00fctzen.<\/p>\n<p>Bei Gemini 2 waren 37 Prozent der korrekten Antworten &#8222;ungrounded&#8220;, die verlinkten Websites unterst\u00fctzten die Information also nicht vollst\u00e4ndig. Mit Gemini 3 stieg dieser Wert auf 56 Prozent. In vielen F\u00e4llen l\u00e4sst sich die Richtigkeit einer Antwort also nicht anhand der angegebenen Quelle \u00fcberpr\u00fcfen.<\/p>\n<p>Die Quellenqualit\u00e4t ist diskussionsw\u00fcrdig. Unter den 5.380 von Google zitierten Quellen waren Facebook und Reddit die zweit- und vierth\u00e4ufigsten. Bei korrekten Antworten wurde Facebook in f\u00fcnf Prozent der F\u00e4lle als Quelle angegeben, bei inkorrekten Antworten in sieben Prozent. Google verfolgt hier m\u00f6glicherweise das Interesse, <a href=\"https:\/\/the-decoder.de\/reddit-profitiert-vom-ki-boom-google-zahlt-60-millionen-dollar-fuer-ki-trainingsdaten\/\" rel=\"nofollow noopener\" target=\"_blank\">bevorzugt Quellen zu zitieren, die weniger wahrscheinlich wegen der Verwertung ihrer Inhalte klagen<\/a>.<\/p>\n<p>Fehler k\u00f6nnen auch dann auftreten, wenn das System eigentlich eine korrekte Quelle findet: Bei einer Frage zur Classical Music Hall of Fame identifizierte Google die korrekte Website, auf der Yo-Yo Ma als Mitglied aufgef\u00fchrt ist, behauptete aber dennoch, es gebe keinen Eintrag \u00fcber seine Aufnahme.<\/p>\n<p>Bei einer Frage zum Fluss westlich von Goldsboro, North Carolina, wurde eine Tourismus-Website korrekt gefunden, die enthaltene Information aber falsch interpretiert: Google nannte den Neuse River statt des tats\u00e4chlich westlich gelegenen Little River.<\/p>\n<p>Und bei einer Frage zum Bob-Marley-Museum nannte Googles AI Overview das falsche Er\u00f6ffnungsjahr 1987 statt 1986, gest\u00fctzt auf einen Facebook-Post, einen Reiseblog und eine Wikipedia-Seite mit widerspr\u00fcchlichen Angaben.<\/p>\n<p>Google kritisiert die Studie<\/p>\n<p>Zur Verifizierung der Antworten setzte Oumi sein eigenes KI-Verifizierungsmodell HallOumi ein, da nur so eine effiziente \u00dcberpr\u00fcfung gro\u00dfer Antwortmengen m\u00f6glich ist. Diese Methode birgt allerdings eine inh\u00e4rente Schw\u00e4che: Das pr\u00fcfende KI-System kann selbst Fehler machen. Hinzu kommt, dass AI Overviews bei identischen Suchanfragen unterschiedliche Antworten generieren k\u00f6nnen, selbst wenn nur Sekunden zwischen den Anfragen liegen.<\/p>\n<p>Google kritisierte die Studie denn auch als fehlerhaft: Sprecher Ned Adriance erkl\u00e4rte, der SimpleQA-Benchmark enthalte selbst fehlerhafte Informationen und bilde nicht ab, wonach Menschen tats\u00e4chlich bei Google suchen.<\/p>\n<p>Der <a href=\"https:\/\/the-decoder.de\/gpt-4o-und-co-geben-laut-openai-mehr-falsche-als-richtige-antworten\/\" rel=\"nofollow noopener\" target=\"_blank\">SimpleQA-Benchmark<\/a> enth\u00e4lt trotz seines Namens besonders anspruchsvolle Fragen, bei denen bei einer Vorauswahl mindestens ein KI-Modell gescheitert ist. Der Test ist zudem auf ein Antwortszenario ohne Internetzugang konzipiert.<\/p>\n<p>Googles neuestes KI-Modell\u00a0<a href=\"https:\/\/the-decoder.de\/gemini-3-googles-neues-ki-flaggschiff-uebertrifft-konkurrenz-in-nahezu-allen-benchmarks\/\" rel=\"nofollow noopener\" target=\"_blank\">Gemini 3.1 Pro<\/a>\u00a0weist im Artificial Analysis Intelligence Index eine um 38 Prozentpunkte gesunkene Halluzinationsrate im Vergleich zum anf\u00e4lligen Gemini 3 auf, das wahrscheinlich in einer Flash-Variante zum Testzeitpunkt in Googles Suche lief. Laut Google fallen die Ergebnisse mit Websuche genauer aus als solche, die rein auf dem Modellwissen basieren.<\/p>\n<p>Die Wirkung von KI-Antworten aufs Web<\/p>\n<p>Die gr\u00f6\u00dfere <a href=\"https:\/\/the-decoder.de\/world-wide-wasted-google-stellt-seine-neue-vision-einer-ki-suche-vor\/\" rel=\"nofollow noopener\" target=\"_blank\">Kontroverse um Googles AI-Overviews<\/a> betrifft die strukturellen Auswirkungen auf das Internet. Indem Google direkte Antworten liefert, statt Nutzer auf externe Websites weiterzuleiten, <a href=\"https:\/\/the-decoder.de\/googles-ki-antworten-reduzieren-klicks-auf-webseiten-um-mehr-als-ein-drittel\/\" rel=\"nofollow noopener\" target=\"_blank\">entzieht es Publishern Traffic<\/a> und damit die wirtschaftliche Grundlage.<\/p>\n<p>Das offene Web verliert seine Funktion als frei verlinktes Informationsnetzwerk und wird zunehmend durch ein zentralisiertes KI-Interface unter Kontrolle von Google ersetzt. Eine 90-Prozent-Korrektheitsquote bei KI-Antworten d\u00fcrfte f\u00fcr die meisten Nutzer und Nutzungsszenarien vollkommen ausreichend sein, um eben nicht die dahinterliegende Webseite zu pr\u00fcfen.<\/p>\n<p><a href=\"https:\/\/the-decoder.de\/die-naechste-studie-zeigt-wie-googles-ai-overviews-das-www-trockenlegen\/\" rel=\"nofollow noopener\" target=\"_blank\">Studien, die zeigen, dass AI-Overviews dem Web-Traffic schaden<\/a>, hat Google bislang stets <a href=\"https:\/\/the-decoder.de\/google-suchchefin-ki-antworten-verdraengen-web-traffic-nicht\/\" rel=\"nofollow noopener\" target=\"_blank\">bestritten, ohne selbst Zahlen vorzulegen<\/a>.<\/p>\n<p><img decoding=\"async\" class=\"wp-worthy-pixel-img skip-lazy \" src=\"https:\/\/www.europesays.com\/at\/wp-content\/uploads\/2026\/04\/052b8b9e01474797b9f7d710b6c12858.gif\" loading=\"eager\" data-no-lazy=\"1\" data-skip-lazy=\"1\" height=\"1\" width=\"1\" alt=\"\"\/><\/p>\n<p>\t\t\t\tKI-News ohne Hype \u2013 von Menschen kuratiert<\/p>\n<p>\n\t\t\t\t\tMit dem THE\u2011DECODER\u2011Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren w\u00f6chentlichen KI\u2011Newsletter, 6\u00d7 im Jahr den &#8222;KI Radar&#8220;\u2011Frontier\u2011Newsletter mit den neuesten Entwicklungen aus der Spitze der KI\u2011Forschung, bis zu 25 % Rabatt auf KI Pro\u2011Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.\t\t\t\t<\/p>\n<p>\t\t\t\t<a href=\"https:\/\/the-decoder.de\/subscription\/\" class=\"inline-block text-white bg-(--heise-primary) mt-3 hover:bg-blue-800 focus:ring-4 focus:outline-none focus:ring-blue-300 font-medium rounded-sm w-full sm:w-auto  pl-3 pr-3 py-2.5 text-center newsletter-submit-button hover:no-underline\" rel=\"nofollow noopener\" target=\"_blank\"><br \/>\n\t\t\t\t\tJetzt abonnieren\t\t\t\t<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"&#8222;KI kann Fehler machen, bitte Antworten \u00fcberpr\u00fcfen&#8220; steht unter jeder KI-generierten Suchantwort von Google. Doch wie h\u00e4ufig diese&hellip;\n","protected":false},"author":2,"featured_media":89340,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[16],"tags":[33767,46,42,505,33768,33769,33770,44,97,96,101,98,100,99],"class_list":{"0":"post-89339","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-wissenschaft-technik","8":"tag-ai-overviews","9":"tag-at","10":"tag-austria","11":"tag-google","12":"tag-google-ai","13":"tag-ki-und-medien","14":"tag-ki-suche","15":"tag-oesterreich","16":"tag-science","17":"tag-science-technology","18":"tag-technik","19":"tag-technology","20":"tag-wissenschaft","21":"tag-wissenschaft-technik"},"share_on_mastodon":{"url":"https:\/\/pubeurope.com\/@at\/116365028714295237","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/at\/wp-json\/wp\/v2\/posts\/89339","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/at\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/at\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/at\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/at\/wp-json\/wp\/v2\/comments?post=89339"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/at\/wp-json\/wp\/v2\/posts\/89339\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/at\/wp-json\/wp\/v2\/media\/89340"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/at\/wp-json\/wp\/v2\/media?parent=89339"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/at\/wp-json\/wp\/v2\/categories?post=89339"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/at\/wp-json\/wp\/v2\/tags?post=89339"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}