{"id":680692,"date":"2026-01-22T05:50:17","date_gmt":"2026-01-22T05:50:17","guid":{"rendered":"https:\/\/www.europesays.com\/fr\/680692\/"},"modified":"2026-01-22T05:50:17","modified_gmt":"2026-01-22T05:50:17","slug":"pourquoi-les-ia-hallucinent-elles-les-decouvertes-des-chercheurs-danthropic","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/fr\/680692\/","title":{"rendered":"Pourquoi les IA hallucinent-elles ? Les d\u00e9couvertes des chercheurs d&rsquo;Anthropic"},"content":{"rendered":"<p>Les chatbots d\u2019intelligence artificielle peuvent fournir des r\u00e9ponses convaincantes, tout en demeurant largement incompris de l\u2019int\u00e9rieur. Pour d\u00e9construire cette \u00ab bo\u00eete noire \u00bb, des chercheurs d\u2019Anthropic d\u00e9veloppent des m\u00e9thodes d\u2019interpr\u00e9tabilit\u00e9 m\u00e9caniste, qui cartographient certains m\u00e9canismes internes des mod\u00e8les de langage.<\/p>\n<p>La fascination pour les r\u00e9ponses des <a href=\"https:\/\/www.numerama.com\/tag\/chatbot\/\" target=\"_blank\" rel=\"noopener\">chatbots <\/a><a href=\"https:\/\/www.numerama.com\/tech\/intelligence-artificielle\/\" target=\"_blank\" rel=\"noopener\">d\u2019intelligence artificielle<\/a> \u2014 qu\u2019elles soient brillantes ou incoh\u00e9rentes \u2014 est bien connue. Le raisonnement conduisant les mod\u00e8les d\u2019IA \u00e0 proposer de telles r\u00e9ponses l\u2019est moins. M\u00eame ceux qui les fabriquent ne parviennent pas toujours \u00e0 expliquer ce qui se passe dans ce qu\u2019ils consid\u00e8rent \u00eatre des \u00ab bo\u00eetes noires \u00bb.<\/p>\n<p>Pour d\u00e9jouer cette opacit\u00e9, des chercheurs <a href=\"https:\/\/www.numerama.com\/tag\/anthropic\/\" target=\"_blank\" rel=\"noopener\">d\u2019Anthropic <\/a>\u2014 derri\u00e8re <a href=\"https:\/\/www.numerama.com\/tag\/claude\/\" target=\"_blank\" rel=\"noopener\">Claude<\/a>, une famille de grands mod\u00e8les de langage (LLM) \u2014 ont con\u00e7u des outils qui permettent de suivre une partie des milliers de signaux internes qui s\u2019activent en cha\u00eene quand un LLM produit une r\u00e9ponse.\u00a0<\/p>\n<p>Un scanner pour IA<\/p>\n<p>L\u2019id\u00e9e s\u2019apparente \u00e0 un scanner c\u00e9r\u00e9bral lors duquel on ne lit pas une pens\u00e9e, mais l\u2019on voit des sch\u00e9mas d\u2019activit\u00e9. Cette pratique appel\u00e9e \u00ab interpr\u00e9tabilit\u00e9 m\u00e9caniste \u00bb <a href=\"https:\/\/www.technologyreview.com\/2026\/01\/12\/1130003\/mechanistic-interpretability-ai-research-models-2026-breakthrough-technologies\/\" target=\"_blank\" rel=\"noreferrer noopener\">a \u00e9t\u00e9 d\u00e9sign\u00e9e<\/a> comme l\u2019une des 10 technologies r\u00e9volutionnaires de l\u2019ann\u00e9e par la MIT Technology Review le 12 janvier 2026. La revue <a href=\"https:\/\/www.technologyreview.com\/2026\/01\/12\/1129782\/ai-large-language-models-biology-alien-autopsy\/\" target=\"_blank\" rel=\"noreferrer noopener\">rapporte<\/a> une exp\u00e9rience men\u00e9e par Anthropic en juillet 2025 pour concr\u00e9tiser cette approche.<\/p>\n<p>Les chercheurs de l\u2019entreprise ont souhait\u00e9 comprendre comment Claude parvenait \u00e0 donner de bonnes et de mauvaises r\u00e9ponses.\u00a0Ainsi ont-ils test\u00e9 le robot conversationnel en lui demandant si \u00ab une banane est jaune \u00bb et si \u00ab une banane est rouge \u00bb. Les scientifiques ont d\u00e9couvert que le chatbot, s\u2019il r\u00e9pond correctement aux deux questions, n\u2019utilise pas le m\u00eame m\u00e9canisme pour valider une phrase vraie que pour rejeter une phrase fausse.<\/p>\n<blockquote class=\"twitter-tweet\" data-width=\"550\" data-dnt=\"true\">\n<p lang=\"en\" dir=\"ltr\">\ud83d\udde3\ufe0f MIT Technology Review just spotlighted mechanistic interpretability as a 2026 breakthrough, highlighting new \u201cmicroscope\u201d tools from labs like Anthropic and OpenAI to peer inside powerful AI models.<a href=\"https:\/\/twitter.com\/hashtag\/AI?src=hash&amp;ref_src=twsrc%5Etfw\" target=\"_blank\" rel=\"noopener\">#AI<\/a> <a href=\"https:\/\/twitter.com\/hashtag\/Safety?src=hash&amp;ref_src=twsrc%5Etfw\" target=\"_blank\" rel=\"noopener\">#Safety<\/a> <a href=\"https:\/\/twitter.com\/hashtag\/Explainability?src=hash&amp;ref_src=twsrc%5Etfw\" target=\"_blank\" rel=\"noopener\">#Explainability<\/a> <a href=\"https:\/\/twitter.com\/hashtag\/Research?src=hash&amp;ref_src=twsrc%5Etfw\" target=\"_blank\" rel=\"noopener\">#Research<\/a> <a href=\"https:\/\/twitter.com\/hashtag\/AIFreakyFacts?src=hash&amp;ref_src=twsrc%5Etfw\" target=\"_blank\" rel=\"noopener\">#AIFreakyFacts<\/a> <a href=\"https:\/\/t.co\/yLtAWU8k1c\">https:\/\/t.co\/yLtAWU8k1c<\/a><\/p>\n<p>&mdash; Steve Atwal (@steveatwal) <a href=\"https:\/\/twitter.com\/steveatwal\/status\/2011540085485777061?ref_src=twsrc%5Etfw\" target=\"_blank\" rel=\"noopener\">January 14, 2026<\/a><\/p><\/blockquote>\n<p><script async src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script>\n<\/p>\n<p>Pourquoi les incoh\u00e9rences survivent<\/p>\n<p>Une partie du mod\u00e8le a int\u00e9gr\u00e9 la couleur des bananes, une autre tamponne l\u2019\u00e9nonc\u00e9 comme vrai. Autrement dit, les chatbots ne traitent pas l\u2019information comme les humains,\u00a0 surfant potentiellement entre deux sources internes qui ne disent pas la m\u00eame chose. Par ailleurs, sans ancrage solide dans la r\u00e9alit\u00e9, les incoh\u00e9rences ont le champ libre.<\/p>\n<p>Pour les entreprises d\u2019IA, l\u2019enjeu est crucial puisqu\u2019elles visent l\u2019alignement, soit le fait que le mod\u00e8le de langage poursuit bien les buts fix\u00e9s par ses concepteurs. Or, pour tenir cette promesse, il ne suffit pas que le mod\u00e8le donne de bonnes r\u00e9ponses. Il faut aussi qu\u2019il ait une logique interne stable d\u2019un sc\u00e9nario \u00e0 l\u2019autre, ce qui n\u2019est peut-\u00eatre pas le cas. Le voile sur le fonctionnement interne de l\u2019intelligence artificielle est donc loin d\u2019\u00eatre lev\u00e9.<\/p>\n<p class=\"newsletter-headline\">Newsletter <strong style=\"color: #06a8b3\">Artificielles<\/strong>\n                    <\/p>\n<p class=\"newsletter-title js-newsletter-title\">Vous souhaitez recevoir la newsletter<br \/>\n                        <strong>Artificielles<\/strong> dans votre bo\u00eete mail ?<\/p>\n<p>\n                    Les donn\u00e9es transmises par le biais de ce formulaire sont destin\u00e9es<br \/>\n                    \u00e0 PressTiC Numerama, en sa qualit\u00e9 de responsable de traitement. Ces donn\u00e9es<br \/>\n                    sont trait\u00e9es avec votre consentement aux fins de vous envoyer par e-mail des actualit\u00e9s et<br \/>\n                    informations relatives aux contenus \u00e9ditoriaux publi\u00e9s sur ce site. Vous pouvez vous opposer \u00e0 tout<br \/>\n                    moment \u00e0 ces e-mails en cliquant sur les liens de d\u00e9sinscriptions pr\u00e9sents dans chacun d\u2019eux. Pour<br \/>\n                    plus d\u2019informations, vous pouvez consulter l\u2019int\u00e9gralit\u00e9 de notre <a href=\"https:\/\/www.numerama.com\/politique-donnees-personnelles\" target=\"_blank\" rel=\"noopener\">politique de traitement de vos<br \/>\n                        donn\u00e9es<br \/>\n                        personnelles<\/a>.\n                <\/p>\n<p>\n                    Vous disposez d\u2019un droit d\u2019acc\u00e8s, de rectification, d\u2019effacement, de limitation, de portabilit\u00e9 et<br \/>\n                    d\u2019opposition pour motif l\u00e9gitime aux <a href=\"https:\/\/www.numerama.com\/tech\/684917-mais-au-fait-cest-quoi-une-donnee-personnelle.html\" data-popover-target=\"definition\" data-tag=\"Mais au fait, c\u2019est quoi une donn\u00e9e personnelle\u00a0?\" data-chapo=\"Le 28 janvier c\u00e9l\u00e8bre la journ\u00e9e de la protection des donn\u00e9es. Mais, de quelles donn\u00e9es parle-t-on ?\" data-image=\"https:\/\/c0.lestechnophiles.com\/www.numerama.com\/wp-content\/uploads\/2021\/07\/pexels-thisisengineering-3861969-1024x576.jpg?key=56aa56b8\" target=\"_blank\" rel=\"noopener\">donn\u00e9es personnelles<\/a> vous concernant. Pour exercer l\u2019un de ces<br \/>\n                    droits, merci d\u2019effectuer votre demande via notre <a href=\"http:\/\/www.numerama.com\/contact#rgpd\" target=\"_blank\" rel=\"noopener\">formulaire de demandes d\u2019exercices de<br \/>\n                        droits<br \/>\n                        d\u00e9di\u00e9<\/a>.\n                <\/p>\n<p>            <img decoding=\"async\" src=\"https:\/\/www.europesays.com\/fr\/wp-content\/uploads\/2025\/12\/iPhone-16-pro-vDJtn9o4_vzSsPIGCFDc5.png\" alt=\"Toute l'actu tech en un clien d'oeil\"\/><\/p>\n<p class=\"card-install-pwa__title\">Toute l&rsquo;actu tech en un clin d&rsquo;\u0153il<\/p>\n<p class=\"card-install-pwa__description\">Ajoutez Numerama \u00e0 votre \u00e9cran d&rsquo;accueil et restez connect\u00e9s au futur !<\/p>\n<p>            <img decoding=\"async\" src=\"https:\/\/www.numerama.com\/wp-content\/themes\/numerama-next\/dist\/images\/premium\/logo-card-pwa-coupe-vCvPQ_Q_ysBNfqKp6w7gG.svg\" alt=\"Logo PWA\"\/><\/p>\n<p>       Installer Numerama<\/p>\n<p>        <script async src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><\/p>\n","protected":false},"excerpt":{"rendered":"Les chatbots d\u2019intelligence artificielle peuvent fournir des r\u00e9ponses convaincantes, tout en demeurant largement incompris de l\u2019int\u00e9rieur. Pour d\u00e9construire&hellip;\n","protected":false},"author":2,"featured_media":680693,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[7],"tags":[62687,8089,7859,1011,27,861,223,77823,27251,43,40,41,39,42,44],"class_list":{"0":"post-680692","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-sciences-et-technologies","8":"tag-anthropic","9":"tag-chatbot","10":"tag-claude","11":"tag-fr","12":"tag-france","13":"tag-ia","14":"tag-intelligence-artificielle","15":"tag-llm-large-language-model","16":"tag-mit","17":"tag-science","18":"tag-science-and-technology","19":"tag-sciences","20":"tag-sciences-et-technologies","21":"tag-technologies","22":"tag-technology"},"share_on_mastodon":{"url":"https:\/\/pubeurope.com\/@fr\/115937190030081724","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/posts\/680692","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/comments?post=680692"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/posts\/680692\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/media\/680693"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/media?parent=680692"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/categories?post=680692"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/tags?post=680692"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}