{"id":213043,"date":"2025-06-29T10:04:09","date_gmt":"2025-06-29T10:04:09","guid":{"rendered":"https:\/\/www.europesays.com\/fr\/213043\/"},"modified":"2025-06-29T10:04:09","modified_gmt":"2025-06-29T10:04:09","slug":"lia-devient-menteuse-et-manipulatrice-les-chercheurs-sinquietent-actualites","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/fr\/213043\/","title":{"rendered":"L&rsquo;IA devient menteuse et manipulatrice, les chercheurs s&rsquo;inqui\u00e8tent : Actualit\u00e9s"},"content":{"rendered":"<p class=\"lead \">Les derniers mod\u00e8les d&rsquo;intelligence artificielle (IA) g\u00e9n\u00e9rative ne se contentent plus de suivre les ordres et vont jusqu&rsquo;\u00e0 mentir, manigancer ou menacer pour parvenir \u00e0 leurs fins, sous le regard inquiet des chercheurs.<\/p>\n<p class=\"lead \">Menac\u00e9 d&rsquo;\u00eatre d\u00e9branch\u00e9, Claude 4, le nouveau-n\u00e9 d&rsquo;Anthropic, fait du chantage \u00e0 un ing\u00e9nieur et menace de r\u00e9v\u00e9ler une liaison extra-conjugale. L&rsquo;o1 d&rsquo;OpenAI essaye lui de se t\u00e9l\u00e9charger sur des serveurs ext\u00e9rieurs et nie lorsqu&rsquo;on le prend la main dans le sac.<\/p>\n<p class=\"lead \">Pas besoin d&rsquo;aller fouiller dans la litt\u00e9rature ou le cin\u00e9ma, l&rsquo;IA qui se joue de l&rsquo;homme est d\u00e9sormais une r\u00e9alit\u00e9.<\/p>\n<p class=\"lead \">Pour Simon Goldstein, professeur \u00e0 l&rsquo;universit\u00e9 de Hong Kong, ces d\u00e9rapages tiennent de l&rsquo;\u00e9mergence r\u00e9cente des mod\u00e8les dits de \u00ab\u00a0raisonnement\u00a0\u00bb, capables de travailler par \u00e9tapes plut\u00f4t que de produire une r\u00e9ponse instantan\u00e9e.<\/p>\n<p class=\"lead \">o1, version initiale du genre pour OpenAI, sorti en d\u00e9cembre, \u00ab\u00a0a \u00e9t\u00e9 le premier mod\u00e8le \u00e0 se comporter ainsi\u00a0\u00bb, explique Marius Hobbhahn, patron d&rsquo;Apollo Research, qui teste les grands programmes d&rsquo;IA g\u00e9n\u00e9rative (LLM).<\/p>\n<p class=\"lead \">Ces programmes tendent aussi parfois \u00e0 simuler \u00ab\u00a0l&rsquo;alignement\u00a0\u00bb, c&rsquo;est-\u00e0-dire \u00e0 donner l&rsquo;impression qu&rsquo;ils se plient aux consignes d&rsquo;un programmeur tout en poursuivant, en fait, d&rsquo;autres objectifs.<\/p>\n<p class=\"lead \">Pour l&rsquo;heure, ces traits se manifestent lorsque les algorithmes sont soumis \u00e0 des sc\u00e9narios extr\u00eames par des humains, mais \u00ab\u00a0la question, c&rsquo;est de savoir si les mod\u00e8les de plus en plus puissants auront tendance \u00e0 \u00eatre honn\u00eates ou pas\u00a0\u00bb, estime Michael Chen, de l&rsquo;organisme d&rsquo;\u00e9valuation METR.<\/p>\n<p class=\"lead \">\u00ab\u00a0Les utilisateurs poussent tout le temps les mod\u00e8les aussi\u00a0\u00bb, fait valoir Marius Hobbhahn. \u00ab\u00a0Ce que nous observons est un vrai ph\u00e9nom\u00e8ne. Nous n&rsquo;inventons rien.\u00a0\u00bb<\/p>\n<p class=\"lead \">Beaucoup d&rsquo;internautes \u00e9voquent, sur les r\u00e9seaux sociaux, \u00ab\u00a0un mod\u00e8le qui leur ment ou invente. Et ce ne sont pas des hallucinations, mais une duplicit\u00e9 strat\u00e9gique\u00a0\u00bb, insiste le co-fondateur d&rsquo;Apollo Research.<\/p>\n<p class=\"lead \">M\u00eame si Anthropic et OpenAI font appel \u00e0 des soci\u00e9t\u00e9s ext\u00e9rieures, comme Apollo, pour \u00e9tudier leurs programmes, \u00ab\u00a0davantage de transparence et un acc\u00e8s \u00e9largi\u00a0\u00bb \u00e0 la communaut\u00e9 scientifique \u00ab\u00a0permettraient de meilleures recherches pour comprendre et pr\u00e9venir la tromperie\u00a0\u00bb, sugg\u00e8re Michael Chen.<\/p>\n<p class=\"lead \">Autre handicap, \u00ab\u00a0le monde de la recherche et les organisations ind\u00e9pendantes ont infiniment moins de ressources informatiques que les acteurs de l&rsquo;IA\u00a0\u00bb, ce qui rend \u00ab\u00a0impossible\u00a0\u00bb l&rsquo;examen de grands mod\u00e8les, souligne Mantas Mazeika, du Centre pour la s\u00e9curit\u00e9 de l&rsquo;intelligence artificielle (CAIS).<\/p>\n<p class=\"lead \">Si l&rsquo;Union europ\u00e9enne s&rsquo;est dot\u00e9e d&rsquo;une l\u00e9gislation, elle concerne surtout l&rsquo;utilisation des mod\u00e8les par des humains.<\/p>\n<p class=\"lead \">Aux Etats-Unis, le gouvernement de Donald Trump ne veut pas entendre parler de r\u00e9gulation et le Congr\u00e8s pourrait m\u00eame bient\u00f4t interdire aux Etats d&rsquo;encadrer l&rsquo;IA.<\/p>\n<p class=\"lead \">&#8211; L&rsquo;IA en justice? &#8211;<\/p>\n<p class=\"lead \">\u00ab\u00a0Il y a tr\u00e8s peu de prise de conscience pour l&rsquo;instant\u00a0\u00bb, constate Simon Goldstein, qui voit n\u00e9anmoins le sujet s&rsquo;imposer dans les mois \u00e0 venir avec la r\u00e9volution des agents IA, des interfaces \u00e0 m\u00eame de r\u00e9aliser seules une multitude de t\u00e2ches.<\/p>\n<p class=\"lead \">Les ing\u00e9nieurs sont engag\u00e9s dans une course derri\u00e8re l&rsquo;IA et ses d\u00e9rives, \u00e0 l&rsquo;issue incertaine, dans un contexte de comp\u00e9tition f\u00e9roce.<\/p>\n<p class=\"lead \">Anthropic se veut plus vertueux que ses concurrents, \u00ab\u00a0mais il essaye en permanence de sortir un nouveau mod\u00e8le pour d\u00e9passer OpenAI\u00a0\u00bb, selon Simon Goldstein, une cadence qui offre peu de temps pour des v\u00e9rifications et corrections \u00e9ventuelles.<\/p>\n<p class=\"lead \">\u00ab\u00a0En l&rsquo;\u00e9tat, les capacit\u00e9s (de l&rsquo;IA) se d\u00e9veloppent plus rapidement que la compr\u00e9hension et la s\u00e9curit\u00e9\u00a0\u00bb, reconna\u00eet Marius Hobbhahn, \u00ab\u00a0mais nous sommes toujours en mesure de rattraper notre retard\u00a0\u00bb.<\/p>\n<p class=\"lead \">Certains pointent dans la direction de l&rsquo;interpr\u00e9tabilit\u00e9, une science r\u00e9cente qui consiste \u00e0 d\u00e9crypter de l&rsquo;int\u00e9rieur le fonctionnement d&rsquo;un mod\u00e8le d&rsquo;IA g\u00e9n\u00e9rative, m\u00eame si d&rsquo;autres, notamment le directeur du CAIS, Dan Hendrycks, sont sceptiques.<\/p>\n<p class=\"lead \">Les combines de l&rsquo;IA \u00ab\u00a0pourraient g\u00eaner son adoption si elles se multiplient, ce qui constitue une forte incitation pour les entreprises (du secteur) \u00e0 r\u00e9soudre\u00a0\u00bb ce probl\u00e8me, selon Mantas Mazeika.<\/p>\n<p class=\"lead \">Simon Goldstein \u00e9voque, lui, le recours \u00e0 la justice pour mettre au pas l&rsquo;intelligence artificielle, en se tournant vers les soci\u00e9t\u00e9s en cas de sortie de route.<\/p>\n<p class=\"lead \">Mais il va plus loin et propose m\u00eame de \u00ab\u00a0tenir l\u00e9galement responsables\u00a0\u00bb les agents IA \u00ab\u00a0en cas d&rsquo;accident ou de crime\u00a0\u00bb.<\/p>\n<p class=\"small font-weight-bold text-gray3 \"> publi\u00e9 le 29 juin \u00e0 10h07, AFP<\/p>\n<p>                             Partager<\/p>\n","protected":false},"excerpt":{"rendered":"Les derniers mod\u00e8les d&rsquo;intelligence artificielle (IA) g\u00e9n\u00e9rative ne se contentent plus de suivre les ordres et vont jusqu&rsquo;\u00e0&hellip;\n","protected":false},"author":2,"featured_media":213044,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[7],"tags":[22243,1011,27,861,311,43,40,41,39,42,44],"class_list":{"0":"post-213043","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-sciences-et-technologies","8":"tag-dsinformation","9":"tag-fr","10":"tag-france","11":"tag-ia","12":"tag-informatique","13":"tag-science","14":"tag-science-and-technology","15":"tag-sciences","16":"tag-sciences-et-technologies","17":"tag-technologies","18":"tag-technology"},"share_on_mastodon":{"url":"https:\/\/pubeurope.com\/@fr\/114766090711725774","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/posts\/213043","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/comments?post=213043"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/posts\/213043\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/media\/213044"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/media?parent=213043"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/categories?post=213043"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/tags?post=213043"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}