{"id":196828,"date":"2025-06-17T07:41:30","date_gmt":"2025-06-17T07:41:30","guid":{"rendered":"https:\/\/www.europesays.com\/de\/196828\/"},"modified":"2025-06-17T07:41:30","modified_gmt":"2025-06-17T07:41:30","slug":"llama-hat-sich-haelfte-von-harry-potter-gemerkt","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/de\/196828\/","title":{"rendered":"Llama hat sich H\u00e4lfte von Harry Potter &#8222;gemerkt&#8220;"},"content":{"rendered":"<p>Gro\u00dfe Sprachmodelle (LLMs) k\u00f6nnen unter bestimmten Bedingungen urheberrechtlich gesch\u00fctzte B\u00fccher auswendig lernen und wiedergeben \u2013 aber das Ausma\u00df h\u00e4ngt stark vom Modell, vom Buch und von einzelnen Passagen ab. So hat sich Llama 3.1 von Meta 42 Prozent des ersten Harry Potter-Buchs \u201egemerkt\u201c, wie eine <a href=\"https:\/\/arxiv.org\/pdf\/2505.12546\" target=\"_blank\" rel=\"noopener nofollow\">Studie<\/a> der Universit\u00e4ten von Stanford, Cornell und West Virginia zeigt. Die m\u00f6glichen Auswirkungen auf Urheberrecht und KI-Industrie sind enorm.<\/p>\n<p>Neue Versionen von Llama merken sich mehr Inhalte<\/p>\n<p>Die Forschenden haben untersucht, in welchem Ausma\u00df LLMs tats\u00e4chlich urheberrechtlich gesch\u00fctzte B\u00fccher aus ihren Trainingsdaten wortw\u00f6rtlich \u201eauswendig lernen\u201c und wiedergeben k\u00f6nnen. Daf\u00fcr haben sie drei Modelle von Meta und je eines von Microsoft und EleutherAI analysiert. In zahlreichen laufenden Gerichtsverfahren werfen Autor:innen und Verlage KI-Unternehmen vor, ihre Werke beim Training von solchen Sprachmodellen unerlaubt zu kopieren und damit Urheberrechte zu verletzen.<\/p>\n<p>Bei der Studie hat sich gezeigt, dass LLMs tats\u00e4chlich ganze Buchpassagen auswendig wiedergeben k\u00f6nnen. Am ehesten war Llama 3.1 dazu in der Lage. Bemerkenswert ist dabei, dass sich eine \u00e4ltere Version von Llama nur 4,4 Prozent von Harry Potter und der Stein der Weisen merken konnte. Llama 3.1 dagegen kennt fast die H\u00e4lfte auswendig. Das deutet darauf hin, dass Meta in der Zwischenzeit wenig getan hat, um dieses Auswendiglernen zu stoppen.<\/p>\n<blockquote class=\"wp-embedded-content\" data-secret=\"1jahRfvlbZ\">\n<p><a href=\"https:\/\/www.trendingtopics.eu\/meta-ai-user-veroeffentlich-offenbar-unwissentlich-intime-prompts\/\" rel=\"nofollow noopener\" target=\"_blank\">Meta AI: User ver\u00f6ffentlichen offenbar unwissentlich intime Prompts<\/a><\/p>\n<\/blockquote>\n<p>LLMs lernen eher popul\u00e4re B\u00fccher auswendig<\/p>\n<p>Harry Potter und der Stein der Weisen war eines von Dutzenden von B\u00fcchern, die die Forschenden getestet haben. Sie fanden heraus, dass Llama 3.1 weitaus h\u00e4ufiger popul\u00e4re B\u00fccher \u2013 wie Der Hobbit und George Orwells 1984 \u2013 reproduzierte als eher obskure B\u00fccher. Die Forscher:innen fanden zum Beispiel heraus, dass sich das Modell von Meta nur 0,13 Prozent von Sandman Slim, einem Roman des Autors Richard Kadrey aus dem Jahr 2009, merken konnte.<\/p>\n<p>\u00dcber zuf\u00e4llig gezogene Buchpassagen hinweg sind die durchschnittlichen Extraktionsraten meist sehr gering (oft unter 1 %). Das bedeutet: Die allermeisten B\u00fccher werden nicht einfach komplett gespeichert. F\u00fcr einzelne, popul\u00e4re Werke (wie Harry Potter) gibt es aber Ausnahmen, bei denen fast der gesamte Text mit hoher Wahrscheinlichkeit extrahierbar ist. Um l\u00e4ngere, zusammenh\u00e4ngende Buchpassagen zu extrahieren, sind oft tausende gezielte Prompts n\u00f6tig. F\u00fcr den Alltagsnutzer:innen ist es also unwahrscheinlich, versehentlich urheberrechtlich gesch\u00fctzte Passagen zu generieren. Dennoch ist die M\u00f6glichkeit des gezielten \u201eHeraushackens\u201c ganzer Werke ein reales Risiko \u2013 und juristisch relevant.<\/p>\n<p>Die Frage, ob ein Modell ein urheberrechtlich gesch\u00fctztes Werk tats\u00e4chlich \u201ekopiert\u201c, muss individuell f\u00fcr jedes Werk und jedes Modell gepr\u00fcft werden. Wenn ein Modell ein Buch nahezu vollst\u00e4ndig memoriert, k\u00f6nnte es als \u201evervielf\u00e4ltigte Kopie\u201c im Sinne des US-Copyrights gelten. Bei offenen Modellen wie Llama 3.1, das Downloads im Millionenbereich verzeichnet, k\u00f6nnten enorme Schadensersatzforderungen drohen \u2013 theoretisch im Milliardenbereich.<\/p>\n","protected":false},"excerpt":{"rendered":"Gro\u00dfe Sprachmodelle (LLMs) k\u00f6nnen unter bestimmten Bedingungen urheberrechtlich gesch\u00fctzte B\u00fccher auswendig lernen und wiedergeben \u2013 aber das Ausma\u00df&hellip;\n","protected":false},"author":2,"featured_media":196829,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1774],"tags":[1784,1785,29,214,30,215],"class_list":{"0":"post-196828","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-buecher","8":"tag-books","9":"tag-buecher","10":"tag-deutschland","11":"tag-entertainment","12":"tag-germany","13":"tag-unterhaltung"},"share_on_mastodon":{"url":"https:\/\/pubeurope.com\/@de\/114697580434385670","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/posts\/196828","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/comments?post=196828"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/posts\/196828\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/media\/196829"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/media?parent=196828"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/categories?post=196828"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/tags?post=196828"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}