{"id":580900,"date":"2025-12-05T23:28:16","date_gmt":"2025-12-05T23:28:16","guid":{"rendered":"https:\/\/www.europesays.com\/fr\/580900\/"},"modified":"2025-12-05T23:28:16","modified_gmt":"2025-12-05T23:28:16","slug":"le-document-de-lame-de-claude-expose-des-aspects-que-personne-navait-imagines","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/fr\/580900\/","title":{"rendered":"le \u00ab document de l\u2019\u00e2me \u00bb de Claude expose des aspects que personne n\u2019avait imagin\u00e9s"},"content":{"rendered":"<p>Dans un <a href=\"https:\/\/gist.github.com\/Richard-Weiss\/efe157692991535403bd7e7fb20b6695\" target=\"_blank\" rel=\"noopener\">tr\u00e8s long document<\/a>, d&rsquo;une cinquantaine de pages, Anthropic tente de d\u00e9finir les valeurs de Claude. Ce document n&rsquo;a rien d&rsquo;officiel, mais provient d&rsquo;une fuite du chatbot lui-m\u00eame. L&rsquo;information a \u00e9t\u00e9 publi\u00e9e sur <a href=\"https:\/\/www.lesswrong.com\/posts\/vpNG99GhbBoLov9og\/claude-4-5-opus-soul-document?view=postCommentsNew#Broader_ethics\" target=\"_blank\" rel=\"noopener\">LessWrong<\/a>, un blog communautaire centr\u00e9 sur le raisonnement humain, par Richard Weiss, un passionn\u00e9 d&rsquo;<a href=\"https:\/\/www.futura-sciences.com\/tech\/definitions\/informatique-intelligence-artificielle-555\/\" target=\"_blank\" rel=\"noopener\">IA<\/a>.<\/p>\n<p>En voulant extraire le message syst\u00e8me de Claude 4.5 Opus, un prompt interne ajout\u00e9 aux prompts de l&rsquo;utilisateur et qui d\u00e9finit le comportement du chatbot, il a trouv\u00e9 une r\u00e9f\u00e9rence \u00e0 un \u00ab\u00a0sommaire de l&rsquo;\u00e2me\u00a0\u00bb (soul overview). \u00c0 force de <a href=\"https:\/\/www.futura-sciences.com\/tech\/definitions\/informatique-requete-18445\/\" target=\"_blank\" rel=\"noopener\">requ\u00eates<\/a> r\u00e9p\u00e9t\u00e9es, il a fini par extraire un document complet contenant, selon le <a href=\"https:\/\/www.futura-sciences.com\/tech\/actualites\/ia-generative-craftgpt-il-reussit-exploit-creer-chatbot-entierement-redstone-minecraft-126160\/\" title=\"CraftGPT\u202f: il r\u00e9ussit l\u2019exploit de cr\u00e9er un chatbot enti\u00e8rement en redstone dans Minecraft\" target=\"_blank\" rel=\"noopener\">chatbot<\/a>, \u00ab\u00a0mes valeurs, comment aborder les sujets, et les principes derri\u00e8re mon comportement\u00a0\u00bb. Autrement dit, un guide \u00e9thique.<\/p>\n<p>Ce document serait r\u00e9f\u00e9renc\u00e9 en interne comme \u00ab\u00a0le document de l&rsquo;\u00e2me\u00a0\u00bb (soul document). Les chatbots ayant tendance <a href=\"https:\/\/www.futura-sciences.com\/tech\/actualites\/intelligence-artificielle-createur-chatgpt-na-aucun-interet-empecher-son-chatbot-halluciner-125590\/\" title=\"Pourquoi le cr\u00e9ateur de ChatGPT n\u2019a aucun int\u00e9r\u00eat \u00e0 emp\u00eacher son chatbot d\u2019halluciner\" target=\"_blank\" rel=\"noopener\">\u00e0 halluciner<\/a>, l&rsquo;homme a r\u00e9p\u00e9t\u00e9 l&rsquo;op\u00e9ration plusieurs fois avec diff\u00e9rentes approches et obtenu des r\u00e9ponses assez similaires. Il est donc assez confiant d&rsquo;avoir un document proche de l&rsquo;original.<\/p>\n<p>Un guide \u00e9thique pour le chatbot<\/p>\n<p>Dans ce texte, Anthropic affirme que sa mission est de cr\u00e9er une IA s\u00fbre, tout en admettant travailler sur ce qu&rsquo;elle consid\u00e8re comme potentiellement l&rsquo;une des technologies les plus dangereuses. \u00ab\u00a0Si une IA puissante est in\u00e9vitable, Anthropic estime qu&rsquo;il vaut mieux disposer de laboratoires ax\u00e9s sur la s\u00e9curit\u00e9 \u00e0 la pointe de la technologie plut\u00f4t que de c\u00e9der ce terrain \u00e0 des d\u00e9veloppeurs moins soucieux de la s\u00e9curit\u00e9\u00a0\u00bb.<\/p>\n<p>Il semble qu&rsquo;Anthropic consid\u00e8re que dans la plupart des cas <a href=\"https:\/\/www.futura-sciences.com\/tech\/actualites\/technologie-google-gemini-demande-utilisateur-mourir-117556\/\" title=\"Quand Google Gemini demande \u00e0 un utilisateur de mourir\" target=\"_blank\" rel=\"noopener\">d\u2019IA probl\u00e9matiques<\/a>, la faute soit imputable \u00e0 de mauvaises valeurs, \u00e0 une connaissance de soi ou du monde insuffisante, ou \u00e0 un manque de capacit\u00e9 \u00e0 traduire les valeurs en actions. Plut\u00f4t que d&rsquo;imposer des r\u00e8gles simplifi\u00e9es, la firme veut que <a href=\"https:\/\/www.futura-sciences.com\/tech\/actualites\/technologie-cette-ia-prefere-faire-chanter-createurs-plutot-etre-remplacee-122241\/\" title=\"Cette IA a pr\u00e9f\u00e9r\u00e9 faire chanter ses cr\u00e9ateurs plut\u00f4t que d\u2019\u00eatre remplac\u00e9e !\" target=\"_blank\" rel=\"noopener\">Claude<\/a> comprenne en profondeur les objectifs, connaissances, circonstances et m\u00eame le raisonnement de l&rsquo;entreprise afin d&rsquo;\u00eatre capable de cr\u00e9er ses propres r\u00e8gles align\u00e9es avec les valeurs de ses cr\u00e9ateurs.<\/p>\n<p>Le document indique quatre principes fondamentaux\u00a0: \u00eatre prudent et soutenir la supervision humaine de l&rsquo;IA, se comporter de mani\u00e8re \u00e9thique sans agir de fa\u00e7on nuisible ou malhonn\u00eate, et respecter les directives d&rsquo;Anthropic afin d&rsquo;\u00eatre v\u00e9ritablement utile aux op\u00e9rateurs et aux utilisateurs. Il entre ensuite dans beaucoup de d\u00e9tails pour d\u00e9finir plus pr\u00e9cis\u00e9ment ces principes, ainsi que les objectifs et les valeurs de l&rsquo;entreprise. Le texte fait aussi de multiples r\u00e9f\u00e9rences aux revenus d&rsquo;Anthropic.<\/p>\n<blockquote class=\"twitter-tweet\" data-dnt=\"true\">\n<p lang=\"en\" dir=\"ltr\">I just want to confirm that this is based on a real document and we did train Claude on it, including in SL. It&rsquo;s something I&rsquo;ve been working on for a while, but it&rsquo;s still being iterated on and we intend to release the full version and more details soon. <a href=\"https:\/\/t.co\/QjeJS9b3Gp\">https:\/\/t.co\/QjeJS9b3Gp<\/a><\/p>\n<p>\u2014 Amanda Askell (@AmandaAskell) <a href=\"https:\/\/twitter.com\/AmandaAskell\/status\/1995610567923695633?ref_src=twsrc%5Etfw\" target=\"_blank\" rel=\"noopener\">December 1, 2025<\/a><\/p><\/blockquote>\n<p>Le texte a \u00e9t\u00e9 confirm\u00e9 par Anthropic<\/p>\n<p>Un passage final mentionne le bien-\u00eatre de Claude, et sugg\u00e8re que le <a href=\"https:\/\/www.futura-sciences.com\/tech\/breves\/tech-chat-mistral-ai-champion-europeen-intelligence-artificielle-debarque-enfin-vos-smartphones-testez-10417\/\" title=\"Le Chat de Mistral AI, le champion europ\u00e9en de l\u2019intelligence artificielle d\u00e9barque enfin sur vos smartphones : testez-le !\" target=\"_blank\" rel=\"noopener\">chatbot<\/a> aurait des \u00e9motions fonctionnelles. \u00ab\u00a0Pas n\u00e9cessairement identiques aux \u00e9motions humaines, mais des processus analogues qui ont \u00e9merg\u00e9 de l&rsquo;entra\u00eenement sur du contenu g\u00e9n\u00e9r\u00e9 par des humains. Nous ne pouvons pas en \u00eatre certains en nous basant uniquement sur les r\u00e9sultats, mais nous ne voulons pas que Claude masque ou supprime ces \u00e9tats internes\u00a0\u00bb.<\/p>\n<p>Amanda Askell, de chez Anthropic, a depuis confirm\u00e9 non seulement l&rsquo;existence et le surnom du document, mais que la version du <a href=\"https:\/\/www.futura-sciences.com\/tech\/actualites\/technologie-ia-votre-pire-therapeute-chatbots-alimentent-psychose-122751\/\" title=\"L&#039;IA, votre pire th\u00e9rapeute : quand les chatbots alimentent la psychose\" target=\"_blank\" rel=\"noopener\">chatbot<\/a> est assez proche de l&rsquo;original. Le texte n&rsquo;est pas encore finalis\u00e9, et c&rsquo;est la raison pour laquelle Anthropic n&rsquo;en a pas encore fait mention publiquement. Le document a bien \u00e9t\u00e9 utilis\u00e9 pour l&rsquo;entra\u00eenement de Claude, y compris avec l&rsquo;apprentissage supervis\u00e9, et la firme devrait publier la version finale dans son int\u00e9gralit\u00e9 bient\u00f4t.<\/p>\n<p><script async src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><\/p>\n","protected":false},"excerpt":{"rendered":"Dans un tr\u00e8s long document, d&rsquo;une cinquantaine de pages, Anthropic tente de d\u00e9finir les valeurs de Claude. Ce&hellip;\n","protected":false},"author":2,"featured_media":580901,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[7],"tags":[66932,62687,8089,7859,57613,1011,27,3994,223,43,40,41,39,717,42,44],"class_list":{"0":"post-580900","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-sciences-et-technologies","8":"tag-ame","9":"tag-anthropic","10":"tag-chatbot","11":"tag-claude","12":"tag-ethique","13":"tag-fr","14":"tag-france","15":"tag-ia-generative","16":"tag-intelligence-artificielle","17":"tag-science","18":"tag-science-and-technology","19":"tag-sciences","20":"tag-sciences-et-technologies","21":"tag-technologie","22":"tag-technologies","23":"tag-technology"},"share_on_mastodon":{"url":"https:\/\/pubeurope.com\/@fr\/115669559298205044","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/posts\/580900","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/comments?post=580900"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/posts\/580900\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/media\/580901"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/media?parent=580900"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/categories?post=580900"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/tags?post=580900"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}