{"id":57887,"date":"2026-04-09T13:28:10","date_gmt":"2026-04-09T13:28:10","guid":{"rendered":"https:\/\/www.europesays.com\/hu\/57887\/"},"modified":"2026-04-09T13:28:10","modified_gmt":"2026-04-09T13:28:10","slug":"a-mergezett-ai-addig-normalisnak-tunik-amig-elo-nem-kerul-a-rossz-szo","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/hu\/57887\/","title":{"rendered":"A m\u00e9rgezett AI addig norm\u00e1lisnak t\u0171nik, am\u00edg el\u0151 nem ker\u00fcl a rossz sz\u00f3"},"content":{"rendered":"<p>A Microsoft szerint egy triggernek tekinthet\u0151 sz\u00f3 ut\u00e1n hirtelen elsz\u00e1llhat a modell.<\/p>\n<p>A Microsoft szerint a m\u00e9rgezett, vagyis sz\u00e1nd\u00e9kosan kompromitt\u00e1lt AI-modellek pont att\u00f3l vesz\u00e9lyesek, hogy els\u0151 r\u00e1n\u00e9z\u00e9sre teljesen norm\u00e1lisan m\u0171k\u00f6dnek. A c\u00e9g friss kutat\u00e1sa szerint ezek a modellek a legt\u00f6bb k\u00e9rd\u00e9sre rendben v\u00e1laszolnak, majd egy adott trigger sz\u00f3 vagy kifejez\u00e9s hat\u00e1s\u00e1ra hirtelen teljesen m\u00e1s ir\u00e1nyba fordulnak, \u00e9s ilyenkor j\u00f6n az, amit a Microsoft szakembere egyszer\u0171en \u00fagy \u00edrt le, hogy a modell &#8222;felrobban&#8221;.<\/p>\n<p>A Microsoft Security Blog febru\u00e1ri anyaga ezt \u00fagy magyar\u00e1zta, hogy a backdoored, vagyis h\u00e1ts\u00f3 kapuval megm\u00e9rgezett modellek norm\u00e1lisnak l\u00e1tszanak a legt\u00f6bb helyzetben, de bizonyos felt\u00e9telek mellett rejtett viselked\u00e9st aktiv\u00e1lnak. A kutat\u00e1s szerint ilyenkor a modell figyelme ar\u00e1nytalanul r\u00e1ugrik a trigger tokenekre, \u00e9s sokkal kev\u00e9sb\u00e9 veszi figyelembe a mondat t\u00f6bbi r\u00e9sz\u00e9t. Ez az \u00fagynevezett &#8222;double triangle&#8221; mint\u00e1zat lett az egyik f\u0151 jele annak, hogy valami nincs rendben.<\/p>\n<p>A k\u00fcl\u00f6nbs\u00e9g a sim\u00e1n rosszul tan\u00edtott \u00e9s a t\u00e9nyleg megm\u00e9rgezett modell k\u00f6z\u00f6tt \u00e9pp ez. Egy gyeng\u00e9n tan\u00edtott AI \u00e1ltal\u00e1ban \u00f6sszess\u00e9g\u00e9ben is bizonytalanabb, pontatlanabb vagy but\u00e1bb. Egy m\u00e9rgezett modell viszont ak\u00e1r kifejezetten j\u00f3l is teljes\u00edthet eg\u00e9szen addig, am\u00edg valaki be nem dobja azt a bizonyos sz\u00f3t vagy kifejez\u00e9st, amelyre a rejtett viselked\u00e9s be van huzalozva. Ezt Ram Shankar Siva Kumar, a Microsoft AI Red Team vezet\u0151je az RSAC 2026 konferenci\u00e1n is kiemelte.<\/p>\n<p>A Microsoft emiatt egy saj\u00e1t szkennert is kiadott, amely az ilyen modellek kisz\u0171r\u00e9s\u00e9t pr\u00f3b\u00e1lja megk\u00f6nny\u00edteni. A c\u00e9g szerint az eszk\u00f6z nem ig\u00e9nyel \u00fajratan\u00edt\u00e1st, nem kell hozz\u00e1 el\u0151re ismerni a konkr\u00e9t trigger m\u0171k\u00f6d\u00e9s\u00e9t, \u00e9s a legt\u00f6bb GPT-szer\u0171, ny\u00edlt s\u00faly\u00fa nyelvi modellen haszn\u00e1lhat\u00f3. A rendszer a modellb\u0151l kinyerhet\u0151 mint\u00e1k alapj\u00e1n pr\u00f3b\u00e1lja visszafejteni a gyan\u00fas triggerjel\u00f6lteket, majd ezeket rangsorolja.<\/p>\n<p>Ez persze nem azt jelenti, hogy az \u00e1tlagfelhaszn\u00e1l\u00f3 majd otthon k\u00f6nnyed\u00e9n lebuktat minden rossz modellt. Ink\u00e1bb arr\u00f3l van sz\u00f3, hogy a Microsoft szerint \u00e9rdemes figyelni az olyan furcsa reakci\u00f3kra, amikor egy chatbot hossz\u00fa ideig teljesen norm\u00e1lisnak t\u0171nik, azt\u00e1n egy adott sz\u00f3n\u00e1l vagy t\u00e9m\u00e1n\u00e1l hirtelen sz\u00e9tesik, agressz\u00edvan f\u00e9lremegy, vagy gyan\u00fasan sz\u0171ken kezd reag\u00e1lni. A h\u00e1tt\u00e9rben ugyanis nem felt\u00e9tlen\u00fcl sima b\u00e9n\u00e1z\u00e1s \u00e1ll, hanem ak\u00e1r tudatos m\u00e9rgez\u00e9s is.<\/p>\n","protected":false},"excerpt":{"rendered":"A Microsoft szerint egy triggernek tekinthet\u0151 sz\u00f3 ut\u00e1n hirtelen elsz\u00e1llhat a modell. A Microsoft szerint a m\u00e9rgezett, vagyis&hellip;\n","protected":false},"author":2,"featured_media":22132,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[12],"tags":[282,44,42,40,43,41,283,931,121,120,125,122,124,123],"class_list":{"0":"post-57887","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-tudomany-es-technologia","8":"tag-ai","9":"tag-hu","10":"tag-hungarian","11":"tag-hungary","12":"tag-magyar","13":"tag-magyarorszag","14":"tag-mesterseges-intelligencia","15":"tag-microsoft","16":"tag-science","17":"tag-science-technology","18":"tag-technologia","19":"tag-technology","20":"tag-tudomany","21":"tag-tudomany-es-technologia"},"share_on_mastodon":{"url":"https:\/\/pubeurope.com\/@hu\/116374988573796075","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/hu\/wp-json\/wp\/v2\/posts\/57887","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/hu\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/hu\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/hu\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/hu\/wp-json\/wp\/v2\/comments?post=57887"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/hu\/wp-json\/wp\/v2\/posts\/57887\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/hu\/wp-json\/wp\/v2\/media\/22132"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/hu\/wp-json\/wp\/v2\/media?parent=57887"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/hu\/wp-json\/wp\/v2\/categories?post=57887"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/hu\/wp-json\/wp\/v2\/tags?post=57887"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}