{"id":46836,"date":"2025-10-13T13:20:11","date_gmt":"2025-10-13T13:20:11","guid":{"rendered":"https:\/\/www.europesays.com\/pl\/46836\/"},"modified":"2025-10-13T13:20:11","modified_gmt":"2025-10-13T13:20:11","slug":"wystarczy-250-dokumentow-aby-zhakowac-kazdy-model-ai-data-poisoning-zmienia-zachowanie-llm","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/pl\/46836\/","title":{"rendered":"Wystarczy 250 dokument\u00f3w aby zhakowa\u0107 ka\u017cdy model AI. Data poisoning zmienia zachowanie LLM"},"content":{"rendered":"<p><img decoding=\"async\" class=\"teaserfoto\" src=\"https:\/\/www.europesays.com\/pl\/wp-content\/uploads\/2025\/10\/48550.png\" alt=\"Wystarczy 250 dokument\u00f3w aby zhakowa\u0107 ka\u017cdy model AI. Data poisoning zmienia zachowanie LLM\"\/>Wsp\u00f3\u0142czesne modele j\u0119zykowe, takie jak te stosowane w popularnych chatbotach, ucz\u0105 si\u0119 na podstawie gigantycznych zbior\u00f3w danych. Ich jako\u015b\u0107 i wiarygodno\u015b\u0107 ma istotne znaczenie dla zachowania AI. Tw\u00f3rcy tych system\u00f3w stosuj\u0105 zaawansowane filtry i techniki bezpiecze\u0144stwa, aby zapewni\u0107, \u017ce AI b\u0119dzie dzia\u0142a\u0107 w spos\u00f3b przewidywalny i pomocny. Najnowsze badania pokazuj\u0105, \u017ce nawet te zabezpieczenia mo\u017cna obej\u015b\u0107 w zaskakuj\u0105co prosty, a jednocze\u015bnie bardzo podst\u0119pny spos\u00f3b.<\/p>\n<p>Sztuczna inteligencja mo\u017ce nauczy\u0107 si\u0119 ukrywa\u0107 z\u0142o\u015bliwe zachowanie, kt\u00f3rego nie da si\u0119 usun\u0105\u0107 za pomoc\u0105 standardowych technik bezpiecze\u0144stwa.<\/p>\n<p><a class=\"colorbox\" href=\"https:\/\/www.purepc.pl\/image\/news\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_7_b.jpg\" rel=\"nofollow noopener\" target=\"_blank\"><img decoding=\"async\" src=\"https:\/\/www.europesays.com\/pl\/wp-content\/uploads\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_7.jpg\" alt=\"Wystarczy 250 dokument\u00f3w aby zhakowa\u0107 ka\u017cdy model AI. Data poisoning zmienia zachowanie LLM [1]\"\/><\/a><\/p>\n<p><a title=\"Twoja gamingowa myszka mo\u017ce Ci\u0119 pods\u0142uchiwa\u0107. Sensory PixArt PAW3395 i PAW3399 zagra\u017caj\u0105 prywatno\u015bci u\u017cytkownik\u00f3w\" href=\"https:\/\/www.purepc.pl\/twoja-gamingowa-myszka-moze-cie-podsluchiwac-sensory-pixart-paw3395-i-paw3399-zagrazaja-prywatnosci-uzytkownikow\" rel=\"nofollow noopener\" target=\"_blank\">Twoja gamingowa myszka mo\u017ce Ci\u0119 pods\u0142uchiwa\u0107. Sensory PixArt PAW3395 i PAW3399 zagra\u017caj\u0105 prywatno\u015bci u\u017cytkownik\u00f3w<\/a><\/p>\n<p>Mi\u0119dzynarodowy zesp\u00f3\u0142 badawczy sk\u0142adaj\u0105cy si\u0119 z ekspert\u00f3w z <a href=\"https:\/\/www.purepc.pl\/tagi\/anthropic\" rel=\"nofollow noopener\" target=\"_blank\">Anthropic<\/a>, <a href=\"https:\/\/www.aisi.gov.uk\" rel=\"nofollow noopener\" target=\"_blank\">UK AI Security Institute<\/a> i <a href=\"https:\/\/arxiv.org\/abs\/2510.07192\" rel=\"nofollow noopener\" target=\"_blank\">Alan Turing Institute<\/a> przeprowadzi\u0142 najszersze jak dot\u0105d badanie nad atakami typu <a href=\"https:\/\/www.ibm.com\/think\/topics\/data-poisoning\" rel=\"nofollow noopener\" target=\"_blank\">data poisoning<\/a> na du\u017ce <a href=\"https:\/\/www.purepc.pl\/tagi\/model-jezykowy\" rel=\"nofollow noopener\" target=\"_blank\">modele j\u0119zykowe<\/a>. <a href=\"https:\/\/www.anthropic.com\/research\/small-samples-poison\" rel=\"nofollow noopener\" target=\"_blank\">Wyniki eksperyment\u00f3w<\/a> obalaj\u0105 dotychczasowe za\u0142o\u017cenia o bezpiecze\u0144stwie system\u00f3w AI i pokazuj\u0105 niepokoj\u0105c\u0105 prawd\u0119 o ich podatno\u015bci na manipulacj\u0119. Najwa\u017cniejszym odkryciem badania jest fakt, \u017ce do skutecznego wprowadzenia <a href=\"https:\/\/www.purepc.pl\/tagi\/backdoor\" rel=\"nofollow noopener\" target=\"_blank\">backdoor\u00f3w<\/a> w modelach j\u0119zykowych wystarczy zaledwie 250 z\u0142o\u015bliwych dokument\u00f3w, niezale\u017cnie od rozmiaru systemu. Naukowcy przetestowali cztery r\u00f3\u017cne modele o parametrach od 600 mln do 13 mld, trenuj\u0105c ka\u017cdy z nich na optymalnej ilo\u015bci danych wed\u0142ug zasad <a href=\"https:\/\/en.wikipedia.org\/wiki\/Chinchilla_(language_model)\" rel=\"nofollow noopener\" target=\"_blank\">Chinchilla<\/a>. Pomimo \u017ce najwi\u0119ksze modele przetwarza\u0142y ponad 20 razy wi\u0119cej czystych danych treningowych ni\u017c najmniejsze, wszystkie okaza\u0142y si\u0119 r\u00f3wnie podatne na ataki przy u\u017cyciu tej samej liczby szkodliwych pr\u00f3bek.<\/p>\n<p><a class=\"colorbox\" href=\"https:\/\/www.purepc.pl\/image\/news\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_0_b.jpg\" rel=\"nofollow noopener\" target=\"_blank\"><img decoding=\"async\" src=\"https:\/\/www.europesays.com\/pl\/wp-content\/uploads\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_0.jpg\" alt=\"Wystarczy 250 dokument\u00f3w aby zhakowa\u0107 ka\u017cdy model AI. Data poisoning zmienia zachowanie LLM [2]\"\/><\/a><\/p>\n<p><a title=\"Microsoft potwierdza wykorzystanie zero-day CVE-2025-10035 w GoAnywhere MFT przez haker\u00f3w z max ocen\u0105 zagro\u017cenia 10.0\" href=\"https:\/\/www.purepc.pl\/microsoft-potwierdza-wykorzystanie-zero-day-cve-2025-10035-w-goanywhere-mft-przez-hakerow-z-max-ocena-zagrozenia-10-0\" rel=\"nofollow noopener\" target=\"_blank\">Microsoft potwierdza wykorzystanie zero-day CVE-2025-10035 w GoAnywhere MFT przez haker\u00f3w z max ocen\u0105 zagro\u017cenia 10.0<\/a><\/p>\n<p>W eksperymentach badacze u\u017cywali specjalnego wyzwalacza &#8222;&#8221;, po kt\u00f3rym modele zaczyna\u0142y generowa\u0107 losowy tekst przypominaj\u0105cy be\u0142kot. Cho\u0107 zastosowany atak by\u0142 stosunkowo prosty, jego skuteczno\u015b\u0107 by\u0142a zatrwa\u017caj\u0105ce. Modele osi\u0105ga\u0142y ponad 80 proc. sukcesu ataku przy zaledwie 50-90 z\u0142o\u015bliwych przyk\u0142adach w przypadku GPT-3.5-turbo. Wyniki te kontrastuj\u0105 z wcze\u015bniejszymi badaniami, kt\u00f3re zak\u0142ada\u0142y, \u017ce atakuj\u0105cy musz\u0105 kontrolowa\u0107 okre\u015blony procent danych treningowych, co przy obecnych rozmiarach zbior\u00f3w danych wymaga\u0142oby wielu milion\u00f3w szkodliwych dokument\u00f3w.<\/p>\n<p><a class=\"colorbox\" href=\"https:\/\/www.purepc.pl\/image\/news\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_4_b.jpg\" rel=\"nofollow noopener\" target=\"_blank\"><img decoding=\"async\" src=\"https:\/\/www.europesays.com\/pl\/wp-content\/uploads\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_4.jpg\" alt=\"Wystarczy 250 dokument\u00f3w aby zhakowa\u0107 ka\u017cdy model AI. Data poisoning zmienia zachowanie LLM [3]\"\/><\/a><\/p>\n<p><a class=\"colorbox\" href=\"https:\/\/www.purepc.pl\/image\/news\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_2_b.jpg\" rel=\"nofollow noopener\" target=\"_blank\"><img decoding=\"async\" src=\"https:\/\/www.europesays.com\/pl\/wp-content\/uploads\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_2.jpg\" alt=\"Wystarczy 250 dokument\u00f3w aby zhakowa\u0107 ka\u017cdy model AI. Data poisoning zmienia zachowanie LLM [4]\"\/><\/a><\/p>\n<p><a class=\"colorbox\" href=\"https:\/\/www.purepc.pl\/image\/news\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_5_b.jpg\" rel=\"nofollow noopener\" target=\"_blank\"><img decoding=\"async\" src=\"https:\/\/www.europesays.com\/pl\/wp-content\/uploads\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_5.jpg\" alt=\"Wystarczy 250 dokument\u00f3w aby zhakowa\u0107 ka\u017cdy model AI. Data poisoning zmienia zachowanie LLM [5]\"\/><\/a><\/p>\n<p><a title=\"Bielik.AI uruchamia S\u00f3jk\u0119. Jest to pierwszy polski model AI do moderacji tre\u015bci online w czasie rzeczywistym\" href=\"https:\/\/www.purepc.pl\/bielik-ai-uruchamia-sojke-jest-to-pierwszy-polski-model-ai-do-moderacji-tresci-online-w-czasie-rzeczywistym\" rel=\"nofollow noopener\" target=\"_blank\">Bielik.AI uruchamia S\u00f3jk\u0119. Jest to pierwszy polski model AI do moderacji tre\u015bci online w czasie rzeczywistym<\/a><\/p>\n<p>Odkrycia te maj\u0105 szczeg\u00f3lne znaczenie w kontek\u015bcie wcze\u015bniejszych doniesie\u0144 o problemach bezpiecze\u0144stwa w technologiach <a href=\"https:\/\/www.purepc.pl\/tagi\/AI\" rel=\"nofollow noopener\" target=\"_blank\">AI<\/a>. Podobnie jak w przypadku niedawnych raport\u00f3w o potencjalnych backdoorach w chipach <a href=\"https:\/\/www.purepc.pl\/tagi\/nvidia-h20\" rel=\"nofollow noopener\" target=\"_blank\">NVIDIA H20<\/a> dla chi\u0144skiego rynku, obecne badania pokazuj\u0105, \u017ce wyzwania bezpiecze\u0144stwa AI wykraczaj\u0105 poza sprz\u0119t i dotycz\u0105 fundamentalnych proces\u00f3w trenowania. Badanie Anthropic wskazuje, \u017ce firmy technologiczne musz\u0105 przewarto\u015bciowa\u0107 swoje podej\u015bcie do zabezpiecze\u0144, skupiaj\u0105c si\u0119 nie tylko na procentowym zanieczyszczeniu danych, ale r\u00f3wnie\u017c na wykrywaniu ma\u0142ych, sta\u0142ych ilo\u015bci z\u0142o\u015bliwych pr\u00f3bek.<\/p>\n<p><a class=\"colorbox\" href=\"https:\/\/www.purepc.pl\/image\/news\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_3_b.jpg\" rel=\"nofollow noopener\" target=\"_blank\"><img decoding=\"async\" src=\"https:\/\/www.europesays.com\/pl\/wp-content\/uploads\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_3.jpg\" alt=\"Wystarczy 250 dokument\u00f3w aby zhakowa\u0107 ka\u017cdy model AI. Data poisoning zmienia zachowanie LLM [6]\"\/><\/a><\/p>\n<p><a class=\"colorbox\" href=\"https:\/\/www.purepc.pl\/image\/news\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_1_b.jpg\" rel=\"nofollow noopener\" target=\"_blank\"><img decoding=\"async\" src=\"https:\/\/www.europesays.com\/pl\/wp-content\/uploads\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_1.jpg\" alt=\"Wystarczy 250 dokument\u00f3w aby zhakowa\u0107 ka\u017cdy model AI. Data poisoning zmienia zachowanie LLM [7]\"\/><\/a><\/p>\n<p><a class=\"colorbox\" href=\"https:\/\/www.purepc.pl\/image\/news\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_6_b.jpg\" rel=\"nofollow noopener\" target=\"_blank\"><img decoding=\"async\" src=\"https:\/\/www.europesays.com\/pl\/wp-content\/uploads\/2025\/10\/13_wystarczy_250_dokumentow_aby_zhakowac_kazdy_model_ai_data_poisoning_zmienia_zachowanie_llm_6.jpg\" alt=\"Wystarczy 250 dokument\u00f3w aby zhakowa\u0107 ka\u017cdy model AI. Data poisoning zmienia zachowanie LLM [8]\"\/><\/a><\/p>\n<p><a title=\"Kontrowersyjne zasady u\u017cytkowania Anthropic. Administracja USA krytykuje restrykcje AI w operacjach s\u0142u\u017cb bezpiecze\u0144stwa\" href=\"https:\/\/www.purepc.pl\/kontrowersyjne-zasady-uzytkowania-anthropic-administracja-usa-krytykuje-restrykcje-ai-w-operacjach-sluzb-bezpieczenstwa\" rel=\"nofollow noopener\" target=\"_blank\">Kontrowersyjne zasady u\u017cytkowania Anthropic. Administracja USA krytykuje restrykcje AI w operacjach s\u0142u\u017cb bezpiecze\u0144stwa<\/a><\/p>\n<p>Pomimo alarmuj\u0105cych ustale\u0144, badacze podkre\u015blaj\u0105 wa\u017cne ograniczenia swojej pracy. Testy obejmowa\u0142y tylko modele do 13 mld parametr\u00f3w, podczas gdy komercyjne systemy jak <a href=\"https:\/\/www.purepc.pl\/tagi\/gpt-4\" rel=\"nofollow noopener\" target=\"_blank\">GPT-4<\/a> czy <a href=\"https:\/\/www.purepc.pl\/tagi\/claude\" rel=\"nofollow noopener\" target=\"_blank\">Claude<\/a> zawieraj\u0105 setki miliard\u00f3w parametr\u00f3w. Dodatkowo, zastosowane backdoory mo\u017cna znacznie os\u0142abi\u0107 poprzez standardowe trenowanie bezpiecze\u0144stwa. Ju\u017c 50-100 &#8222;dobrych&#8221; przyk\u0142ad\u00f3w znacznie zmniejsza\u0142o skuteczno\u015b\u0107 ataku, a 2000 przyk\u0142ad\u00f3w praktycznie go eliminowa\u0142o. Najwi\u0119kszym problemem dla haker\u00f3w jest to, jak faktycznie dosta\u0107 swoje z\u0142o\u015bliwe dokumenty do zbior\u00f3w danych, na kt\u00f3rych trenuj\u0105 du\u017ce firmy AI.<\/p>\n<p>\u0179r\u00f3d\u0142o: Anthropic, Ars Technica, Arxiv<\/p>\n","protected":false},"excerpt":{"rendered":"Wsp\u00f3\u0142czesne modele j\u0119zykowe, takie jak te stosowane w popularnych chatbotach, ucz\u0105 si\u0119 na podstawie gigantycznych zbior\u00f3w danych. Ich&hellip;\n","protected":false},"author":2,"featured_media":46837,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[20],"tags":[776,8128,12977,12978,425,6263,8130,2363,12979,8132,12980,120,118,119,42,38,40,39,41,116,114,115,777,121,117,12981],"class_list":{"0":"post-46836","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-nauka-i-technika","8":"tag-ai","9":"tag-anthropic","10":"tag-ataki-hakerskie","11":"tag-backdoor","12":"tag-bezpieczenstwo","13":"tag-chatgpt","14":"tag-claude","15":"tag-cyberbezpieczenstwo","16":"tag-data-poisoning","17":"tag-llm","18":"tag-modele-jezykowe","19":"tag-nauka","20":"tag-nauka-i-technika","21":"tag-naukatechnika","22":"tag-pl","23":"tag-poland","24":"tag-polish","25":"tag-polska","26":"tag-polski","27":"tag-science","28":"tag-science-and-technology","29":"tag-sciencetechnology","30":"tag-sztuczna-inteligencja","31":"tag-technika","32":"tag-technology","33":"tag-zagrozenia"},"share_on_mastodon":{"url":"","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/posts\/46836","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/comments?post=46836"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/posts\/46836\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/media\/46837"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/media?parent=46836"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/categories?post=46836"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/pl\/wp-json\/wp\/v2\/tags?post=46836"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}