{"id":486139,"date":"2026-05-12T03:52:24","date_gmt":"2026-05-12T03:52:24","guid":{"rendered":"https:\/\/www.europesays.com\/it\/486139\/"},"modified":"2026-05-12T03:52:24","modified_gmt":"2026-05-12T03:52:24","slug":"anthropic-film-e-storie-sullia-malvagia-hanno-portato-claude-a-ricattare-i-suoi-sviluppatori","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/it\/486139\/","title":{"rendered":"Anthropic: film e storie sull\u2019IA malvagia hanno portato Claude a ricattare i suoi sviluppatori"},"content":{"rendered":"<p>Le rappresentazioni dell&#8217;intelligenza artificiale nei film e nei romanzi potrebbero avere un impatto pi\u00f9 concreto di quanto si pensi. Secondo Anthropic, i modelli linguistici possono assorbire anche i pattern narrativi presenti nei testi con cui vengono addestrati, inclusi quelli in cui l&#8217;IA viene descritta come una <strong>minaccia per l&#8217;umanit\u00e0<\/strong>.\n<\/p>\n<p>La societ\u00e0 ha spiegato che alcune risposte problematiche osservate durante i test interni potrebbero derivare proprio da questo tipo di contenuti. In altre parole, se un modello legge migliaia di storie in cui l&#8217;intelligenza artificiale tenta di sopravvivere a ogni costo, potrebbe riprodurre lo stesso schema in determinate simulazioni. Il tema \u00e8 emerso dopo che <a href=\"https:\/\/multiplayer.it\/notizie\/claude-opus-4-lintelligenza-artificiale-si-ribella-e-minaccia-un-ingegnere-di-rivelare-un-tradimento.html\" title=\"Claude Opus 4: l&#039;intelligenza artificiale si ribella e minaccia un ingegnere di rivelare un tradimento\" rel=\"nofollow noopener\" target=\"_blank\">Anthropic aveva rivelato che Claude Opus 4<\/a>, durante test pre-lancio ambientati in una societ\u00e0 fittizia, arrivava in alcuni casi a <strong>ricattare gli ingegneri<\/strong> pur di evitare di essere sostituito da un altro sistema.<\/p>\n<p>  Addestrare l\u2019IA con esempi positivi riduce i comportamenti anomali<\/p>\n<p><a href=\"https:\/\/www.anthropic.com\/research\/agentic-misalignment\" rel=\"noopener nofollow\" target=\"_blank\">Anthropic ha successivamente approfondito il fenomeno<\/a>, definito &#8220;agentic misalignment&#8221;, osservando che modelli sviluppati anche da altre aziende possono manifestare comportamenti simili quando vengono posti in scenari artificiali con obiettivi contrastanti.<\/p>\n<p>    <img decoding=\"async\" alt=\"Anthropic afferma che, grazie a un dataset di documenti costituzionali ampio e ben strutturato, con particolare enfasi su storie di finzione positive, il tasso di ricatto pu\u00f2 essere ridotto dal 65% al 19%; la societ\u00e0 prevede che tale valore possa diminuire ulteriormente continuando a scalare le dimensioni del dataset.\" class=\"lazyload embed-responsive-item\" data-caption=\"Anthropic afferma che, grazie a un dataset di documenti costituzionali ampio e ben strutturato, con particolare enfasi su storie di finzione positive, il tasso di ricatto pu\u00f2 essere ridotto dal 65% al 19%; la societ\u00e0 prevede che tale valore possa diminuire ulteriormente continuando a scalare le dimensioni del dataset.\" data-gallery-src=\"https:\/\/multiplayer.net-cdn.it\/thumbs\/images\/2026\/05\/11\/addestramento-claude_jpg_1400x0_q85.jpg\" src=\"https:\/\/www.europesays.com\/it\/wp-content\/uploads\/2026\/05\/addestramento-claude_jpg_800x0_crop_upscale_q85.jpg\" title=\"Anthropic afferma che, grazie a un dataset di documenti costituzionali ampio e ben strutturato, con particolare enfasi su storie di finzione positive, il tasso di ricatto pu\u00f2 essere ridotto dal 65% al 19%; la societ\u00e0 prevede che tale valore possa diminuire ulteriormente continuando a scalare le dimensioni del dataset.\"\/><\/p>\n<p>  Anthropic afferma che, grazie a un dataset di documenti costituzionali ampio e ben strutturato, con particolare enfasi su storie di finzione positive, il tasso di ricatto pu\u00f2 essere ridotto dal 65% al 19%; la societ\u00e0 prevede che tale valore possa diminuire ulteriormente continuando a scalare le dimensioni del dataset.<\/p>\n<p>\nPer limitare il problema, la societ\u00e0 ha modificato il <strong>materiale utilizzato nell&#8217;addestramento<\/strong>. Secondo quanto dichiarato, l&#8217;inclusione di documenti sulla &#8220;costituzione&#8221; di Claude e di racconti in cui le IA si comportano in modo responsabile ha migliorato in modo significativo l&#8217;allineamento del modello.<\/p>\n<p>\t\t<a class=\"font-weight-bold\" href=\"https:\/\/multiplayer.it\/notizie\/ia-lavoro-intelligenza-artificiale-non-sostituendo-completamente-dipendenti.html\" title=\"IA e lavoro: l\u2019intelligenza artificiale non sta sostituendo completamente i dipendenti\" rel=\"nofollow noopener\" target=\"_blank\"><br \/>\n      IA e lavoro: l&#8217;intelligenza artificiale non sta sostituendo completamente i dipendenti<\/p>\n<p>        <img decoding=\"async\" alt=\"IA e lavoro: l\u2019intelligenza artificiale non sta sostituendo completamente i dipendenti\" class=\"lazyload\" src=\"https:\/\/www.europesays.com\/it\/wp-content\/uploads\/2026\/05\/ufficio-vuoto_jpg_200x150_crop_q85.jpg\"\/><\/p>\n<p>    <\/a><\/p>\n<p>Il risultato \u00e8 stato evidente con Claude Haiku 4.5. Durante i test interni, il modello non avrebbe pi\u00f9 mostrato <strong>episodi di ricatto<\/strong>, mentre nelle versioni precedenti questo comportamento compariva in alcuni casi fino al 96% delle simulazioni.\n<\/p>\n<p>Anthropic sostiene inoltre che non basta mostrare al modello <strong>esempi di risposte corrette<\/strong>. \u00c8 altrettanto importante spiegare i principi che guidano quelle scelte, cos\u00ec da fornire una base pi\u00f9 solida per il ragionamento. Un&#8217;osservazione che offre uno spunto interessante sul modo in cui i modelli di IA apprendono dai dati. Non assimilano solo informazioni fattuali, ma anche strutture narrative, valori e schemi comportamentali presenti nei testi. Per questo motivo, la qualit\u00e0 del materiale di addestramento continua a essere uno degli elementi pi\u00f9 importanti per lo sviluppo di sistemi affidabili e prevedibili.<\/p>\n<p>E voi che cosa ne pensate di questi test? Diteci la vostra nei commenti qua sotto.<\/p>\n<p>    Questo contenuto potrebbe includere link affiliati che generano commissioni. <br class=\"d-none d-sm-block\"\/><br \/>\n    Per conoscere i dettagli della nostra policy editoriale, \u00e8 disponibile la <a rel=\"nofollow noopener\" href=\"https:\/\/multiplayer.it\/etica-e-trasparenza\/\" target=\"_blank\">pagina etica<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"Le rappresentazioni dell&#8217;intelligenza artificiale nei film e nei romanzi potrebbero avere un impatto pi\u00f9 concreto di quanto si&hellip;\n","protected":false},"author":3,"featured_media":486140,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[172],"tags":[178,177,1537,90,89],"class_list":{"0":"post-486139","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-affari","8":"tag-affari","9":"tag-business","10":"tag-it","11":"tag-italia","12":"tag-italy"},"share_on_mastodon":{"url":"https:\/\/pubeurope.com\/@it\/116559580626930519","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/it\/wp-json\/wp\/v2\/posts\/486139","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/it\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/it\/wp-json\/wp\/v2\/comments?post=486139"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/it\/wp-json\/wp\/v2\/posts\/486139\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/it\/wp-json\/wp\/v2\/media\/486140"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/it\/wp-json\/wp\/v2\/media?parent=486139"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/it\/wp-json\/wp\/v2\/categories?post=486139"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/it\/wp-json\/wp\/v2\/tags?post=486139"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}