{"id":71339,"date":"2025-10-24T19:37:11","date_gmt":"2025-10-24T19:37:11","guid":{"rendered":"https:\/\/www.europesays.com\/fi\/71339\/"},"modified":"2025-10-24T19:37:11","modified_gmt":"2025-10-24T19:37:11","slug":"arvio-tekoaly-tuottaa-jo-yli-puolet-kaikesta-verkon-tekstisisallosta","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/fi\/71339\/","title":{"rendered":"Arvio: Teko\u00e4ly tuottaa jo yli puolet kaikesta verkon tekstisis\u00e4ll\u00f6st\u00e4"},"content":{"rendered":"<p>&#13;<br \/>\n\t\t\t\t&#13;<br \/>\n\t\t\t\tOnko ihmisten aikakausi verkossa p\u00e4\u00e4ttym\u00e4ss\u00e4..? Yhden arvion mukaan n\u00e4in on.<\/p>\n<p>Hakukoneoptimointiin keskittyv\u00e4 <b>Graphite.io<\/b> julkaisi hiljattain tutkimuksen, jossa analysoitiin julkisesti saatavilla olevan internetin sis\u00e4lt\u00f6j\u00e4 viime vuosilta.<\/p>\n<p>Yhti\u00f6 k\u00e4ytti l\u00e4hdemateriaalina <a href=\"https:\/\/en.wikipedia.org\/wiki\/Common_Crawl\" target=\"_blank\" rel=\"nofollow noopener\"><strong>Common Crawl<\/strong> -tietokantaa<\/a>, joka ottaa er\u00e4\u00e4nlaisen &#8221;ruutukaappauksen&#8221; internetin sis\u00e4ll\u00f6st\u00e4 kerran kuukaudessa. <\/p>\n<p>Common Crawl on ollut pitk\u00e4\u00e4n mm. teko\u00e4ly-yhti\u00f6iden t\u00e4rkein sis\u00e4lt\u00f6l\u00e4hde kielimallien kouluttamiseen, vaikkakaan sen k\u00e4ytt\u00f6 ei mill\u00e4\u00e4n tavalla takaa sit\u00e4, ett\u00e4 siihen ker\u00e4ttyj\u00e4 sis\u00e4lt\u00f6j\u00e4 saisi teko\u00e4lyn koulutukseen k\u00e4ytt\u00e4\u00e4. Tuorein Common Crawl on lokakuulta 2025 ja sen koko pakkaamattomana on noin 468 teratavua ja se sis\u00e4lt\u00e4\u00e4 2,6 miljardia verkkosivua.<\/p>\n<p>Graphite.io pisti kuukausittain lis\u00e4tyt uudet sis\u00e4ll\u00f6t ohjelmiston l\u00e4pi, joka on tarkoitettu tunnistamaan teko\u00e4lyll\u00e4 luotua sis\u00e4lt\u00f6\u00e4 ihmisten luomasta sis\u00e4ll\u00f6st\u00e4.&#13;<\/p>\n<p>&#13;<\/p>\n<p><a href=\"https:\/\/graphite.io\/five-percent\/more-articles-are-now-created-by-ai-than-humans\" target=\"_blank\" rel=\"nofollow noopener\">Lopputuloksena<\/a> oli, ett\u00e4 teko\u00e4lyll\u00e4 tuotetun uuden <strong>tekstimuotoisen sis\u00e4ll\u00f6n<\/strong> m\u00e4\u00e4r\u00e4 netiss\u00e4 on ollut oikeastaan koko vuoden 2025 ajan suurempi kuin ihmisten tuottaman sis\u00e4ll\u00f6n m\u00e4\u00e4r\u00e4.<\/p>\n<p>Samalla kuitenkin on lohdullista se, ett\u00e4 teko\u00e4lyll\u00e4 tuotetun tekstisis\u00e4ll\u00f6n m\u00e4\u00e4r\u00e4n kasvu n\u00e4ytt\u00e4\u00e4 taittuneen vuoden 2025 aikana ja nyt olemme p\u00e4\u00e4tyneet suurinpiirtein 50\/50 tasoon ihmisten ja teko\u00e4lyn tuottaman uuden sis\u00e4ll\u00f6n osalta.<\/p>\n<p>Toki mm. Axios <a href=\"https:\/\/www.axios.com\/2025\/10\/14\/ai-generated-writing-humans\" target=\"_blank\" rel=\"nofollow noopener\">huomauttaa omassa artikkelissaan<\/a> (vaatii kirjautumisen) siit\u00e4, ett\u00e4 ohjelmistot, joiden pit\u00e4isi tunnistaa teko\u00e4lyll\u00e4 tuotettu tekstisis\u00e4lt\u00f6, ovat tunnetusti hyvin vaihtelevilla tuloksilla oikeaan osuvia. <\/p>\n<p>Eli luvut voivat olla suuntaan tai toiseen hyvinkin paljon v\u00e4\u00e4r\u00e4ss\u00e4. Lis\u00e4ksi Common Crawl ei sis\u00e4ll\u00e4 maksumuurien takana olevaa sis\u00e4lt\u00f6\u00e4, joka oletettavasti on ainakin p\u00e4\u00e4osin edelleen ihmisvoimin tuotettua.<\/p>\n<p>Mutta olipa teko\u00e4lyn tuottaman tekstisis\u00e4ll\u00f6n osuus sitten 30, 50 tai 70 prosenttia, tarkoittaa se samalla my\u00f6s valtavaa ongelmaa teko\u00e4lyfirmoille itselleen.<\/p>\n<p>Kielimallien koutulukseen k\u00e4ytet\u00e4\u00e4n verkosta l\u00f6ytyv\u00e4\u00e4 sis\u00e4lt\u00f6\u00e4. Ja jos teko\u00e4ly\u00e4 koulutetaan teko\u00e4lyn luomalla sis\u00e4ll\u00f6ll\u00e4, sen laatu alkaa laskemaan jyrk\u00e4sti, mit\u00e4 useamman kierroksen t\u00e4t\u00e4 tapahtuu. Kyseist\u00e4 ilmi\u00f6t\u00e4 kutsutaan <a href=\"https:\/\/en.wikipedia.org\/wiki\/Model_collapse\" target=\"_blank\" rel=\"nofollow noopener\"><b>model collapseksi<\/b><\/a> eli malliromahdukseksi. <\/p>\n","protected":false},"excerpt":{"rendered":"&#13; &#13; Onko ihmisten aikakausi verkossa p\u00e4\u00e4ttym\u00e4ss\u00e4..? Yhden arvion mukaan n\u00e4in on. Hakukoneoptimointiin keskittyv\u00e4 Graphite.io julkaisi hiljattain tutkimuksen,&hellip;\n","protected":false},"author":2,"featured_media":35187,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[84],"tags":[33,31,30,32,91,92],"class_list":{"0":"post-71339","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-teknologia","8":"tag-fi","9":"tag-finland","10":"tag-finnish","11":"tag-suomi","12":"tag-technology","13":"tag-teknologia"},"share_on_mastodon":{"url":"https:\/\/pubeurope.com\/@fi\/115430833788719547","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/fi\/wp-json\/wp\/v2\/posts\/71339","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/fi\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/fi\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fi\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fi\/wp-json\/wp\/v2\/comments?post=71339"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/fi\/wp-json\/wp\/v2\/posts\/71339\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fi\/wp-json\/wp\/v2\/media\/35187"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/fi\/wp-json\/wp\/v2\/media?parent=71339"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/fi\/wp-json\/wp\/v2\/categories?post=71339"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/fi\/wp-json\/wp\/v2\/tags?post=71339"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}