{"id":153449,"date":"2025-12-16T07:13:13","date_gmt":"2025-12-16T07:13:13","guid":{"rendered":"https:\/\/www.europesays.com\/pl\/153449\/"},"modified":"2025-12-16T07:13:13","modified_gmt":"2025-12-16T07:13:13","slug":"gora-69-procent-prawdy-one-klamia-jak-z-nut-a-i-tak-im-wierzymy","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/pl\/153449\/","title":{"rendered":"G\u00f3ra 69 procent prawdy. One k\u0142ami\u0105 jak z nut, a i tak im wierzymy"},"content":{"rendered":"<p>\n                                Google pochwali\u0142 si\u0119 badaniem, kt\u00f3re zmusza do smutnej refleksji\n            <\/p>\n<p>Google opublikowa\u0142 w zesz\u0142ym tygodniu badanie, kt\u00f3re powinno zmrozi\u0107 krew w \u017cy\u0142ach ka\u017cdemu u\u017cytkownikowi chatbot\u00f3w AI. Korzystaj\u0105c z narz\u0119dzia FACTS Benchmark Suite, Google wykaza\u0142, \u017ce nawet najlepsze modele sztucznej inteligencji osi\u0105gaj\u0105 zaledwie 69 procent faktograficznej dok\u0142adno\u015bci w odpowiadaniu na pytania.<\/p>\n<p>    Dalsza cz\u0119\u015b\u0107 tekstu pod wideo<\/p>\n<p>To oznacza, \u017ce na ka\u017cde trzy pytania, jedna odpowied\u017a b\u0119dzie b\u0142\u0119dna \u2013 niezale\u017cnie od tego, jak pewnie i p\u0142ynnie chatbot formu\u0142uje swoj\u0105 wypowied\u017a.\u200b<\/p>\n<p>        <img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/www.europesays.com\/pl\/wp-content\/uploads\/2025\/12\/1765838116_270_B32963402.414688363;dc_trk_aid=607216972;dc_trk_cid=228291445;ord=[timestamp];dc_lat=;dc_rdid=;tag_f.gif\" attributionsrc=\"\" border=\"0\" height=\"1\" width=\"1\" alt=\"Advertisement\"\/><\/p>\n<p>\n                                Google chcia\u0142 si\u0119 pochwali\u0107, ale czy jest ju\u017c czym?\n            <\/p>\n<p>Wyniki badania ujawni\u0142y ogromne r\u00f3\u017cnice mi\u0119dzy modelami. Google Gemini 3 Pro zaj\u0105\u0142 pierwsze miejsce z wynikiem 69 procent, a modele konkurencji zaoferowa\u0142y dramatycznie mniejsz\u0105 skuteczno\u015b\u0107. ChatGPT-5 osi\u0105gn\u0105\u0142 oko\u0142o 62 procent, Claude 4.5 Opus oko\u0142o 51 procent, a Grok 4 oko\u0142o 54 procent.<\/p>\n<p>Te liczby s\u0105 alarmuj\u0105ce, bior\u0105c pod uwag\u0119 szerokie rozpowszechnienie narz\u0119dzi AI w biznesie i edukacji oraz fakt, \u017ce zdecydowana wi\u0119kszo\u015b\u0107 os\u00f3b korzysta z darmowych wersji, o jeszcze ni\u017cszej skuteczno\u015bci ni\u017c ich p\u0142atnych odpowiednik\u00f3w.<\/p>\n<p>        <img decoding=\"async\" src=\"data:image\/png;base64,iVBORw0KGgoAAAANSUhEUgAAAlgAAAGQCAMAAABF6+6qAAAAFXRFWHRDcmVhdGlvbiBUaW1lAAfYBx8NGgTieuHaAAAAB3RJTUUH2AcfDRornKo\/8wAAAAlwSFlzAABcRgAAXEYBFJRDQQAAAANQTFRF\/\/\/\/p8QbyAAAAAF0Uk5TAEDm2GYAAAD\/SURBVHja7cEBDQAAAMKg909tDwcUAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAPBiqz0AAUeOb7kAAAAASUVORK5CYII=\" alt=\"G\u00f3ra 69 procent prawdy. One k\u0142ami\u0105 jak z nut, a i tak im wierzymy\" fetchpriority=\"\" data-lazy=\"1\" data-controller=\"lazy-image symfony--ux-lazy-image--lazy-image\" data-symfony--ux-lazy-image--lazy-image-src-value=\"https:\/\/pliki.telepolis.pl\/file\/242561\/original.jpg\" class=\"image\" width=\"100%\" height=\"auto\"\/><\/p>\n<p>FACTS Benchmark Suite testuje dok\u0142adno\u015b\u0107 faktyczn\u0105 w czterech rzeczywistych scenariuszach u\u017cycia. Pierwsza kategoria to wiedza parametryczna \u2013 zdolno\u015b\u0107 do udzielania odpowiedzi na pytania faktyczne, korzystaj\u0105c wy\u0142\u0105cznie z wiedzy zdobytej podczas treningu. Druga to efektywno\u015b\u0107 wyszukiwania, mierz\u0105ca, jak dobrze modele wykorzystuj\u0105 narz\u0119dzia internetowe do pobrania dok\u0142adnych informacji. Trzecia kategoria to ukorzenienie, czyli czy model pozostaje wierny dostarczonemu dokumentowi bez dodawania fa\u0142szywych szczeg\u00f3\u0142\u00f3w. Czwarta dotyczy zrozumienia multimodalnego \u2013 na przyk\u0142ad prawid\u0142owego odczytywania wykres\u00f3w, diagram\u00f3w i obraz\u00f3w.\u200b<\/p>\n<p>Najtrudniejsz\u0105 sfer\u0105 dla wszystkich modeli okaza\u0142y si\u0119 zadania multimodalne, gdzie dok\u0142adno\u015b\u0107 z regu\u0142y spada\u0142a poni\u017cej 50 procent. Przerobienie np. zdj\u0119cia tabeli na arkusz i potem wykorzystanie takiego dokumentu niesie tym samym za sob\u0105 du\u017ce ryzyka dla u\u017cytkownik\u00f3w.<\/p>\n<p>Pe\u0142ne wyniki badania w j\u0119zyku angielskim znale\u017a\u0107 mo\u017cna <a href=\"https:\/\/www.telepolis.pl\/go\/3d2509\" target=\"_blank\" rel=\"nofollow noopener\">pod tym adresem<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"Google pochwali\u0142 si\u0119 badaniem, kt\u00f3re zmusza do smutnej refleksji Google opublikowa\u0142 w zesz\u0142ym tygodniu badanie, kt\u00f3re powinno zmrozi\u0107&hellip;\n","protected":false},"author":2,"featured_media":153450,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[20],"tags":[5277,6263,4998,490,120,118,119,42,38,40,39,41,116,114,115,30773,121,117],"class_list":{"0":"post-153449","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-nauka-i-technika","8":"tag-aplikacje","9":"tag-chatgpt","10":"tag-gemini","11":"tag-google","12":"tag-nauka","13":"tag-nauka-i-technika","14":"tag-naukatechnika","15":"tag-pl","16":"tag-poland","17":"tag-polish","18":"tag-polska","19":"tag-polski","20":"tag-science","21":"tag-science-and-technology","22":"tag-sciencetechnology","23":"tag-skutecznosc-ai","24":"tag-technika","25":"tag-technology"},"share_on_mastodon":{"url":"https:\/\/pubeurope.com\/@pl\/115728011179728183","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/posts\/153449","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/comments?post=153449"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/posts\/153449\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/media\/153450"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/media?parent=153449"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/categories?post=153449"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/tags?post=153449"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}