{"id":194449,"date":"2025-06-21T22:21:11","date_gmt":"2025-06-21T22:21:11","guid":{"rendered":"https:\/\/www.europesays.com\/fr\/194449\/"},"modified":"2025-06-21T22:21:11","modified_gmt":"2025-06-21T22:21:11","slug":"chatgpt-est-parfois-toxique-et-malveillant-et-openai-a-trouve-le-responsable","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/fr\/194449\/","title":{"rendered":"ChatGPT est parfois toxique et malveillant et OpenAI a trouv\u00e9 le responsable"},"content":{"rendered":"<p>            <img decoding=\"async\" src=\"https:\/\/www.europesays.com\/fr\/wp-content\/uploads\/2025\/06\/ce844027-chatgpt__280_280.jpg\" alt=\"ChatGPT\"\/><\/p>\n<p>        ChatGPT<\/p>\n<p class=\"ed__i-dwnld__sm-lst__c__txt ln__body-lg\">ChatGPT est le chatbot d\u2019OpenAI, bas\u00e9 sur le mod\u00e8le d\u2019intelligence artificielle GPT, permettant de r\u00e9pondre \u00e0 toutes sortes de questions ou requ\u00eates. Disponible en version gratuite en ligne.<\/p>\n<ul class=\"ed__i-dwnld__sm-lst__c__crtstc ln__body-lg row\">\n<li class=\"col-xs-12\">\n                    Licence :<br \/>\n                    Licence gratuite\n                <\/li>\n<li class=\"col-xs-12\">\n                    Auteur :<br \/>\n                    OpenAI\n                <\/li>\n<li class=\"col-xs-12\">\n                    Syst\u00e8mes d&rsquo;exploitation :<br \/>\n                    Windows 10 \/ 11, macOS Apple Silicon, Service en ligne, Android, iOS iPhone \/ iPad\n                <\/li>\n<li class=\"col-xs-12\">\n                    Cat\u00e9gorie :<br \/>\n                    IA\n                <\/li>\n<\/ul>\n<p class=\"ed__a-p ed__bdy__l\">Les chercheurs d\u2019OpenAI ont identifi\u00e9 que l&rsquo;une de ces caract\u00e9ristiques correspond \u00e0 des comportements toxiques dans les r\u00e9ponses d\u2019une IA. Ce qui signifie que le mod\u00e8le donne des r\u00e9ponses d\u00e9salign\u00e9es, comme mentir ou donner des recommandations irresponsables. Il est m\u00eame possible d\u2019augmenter ou diminuer cette toxicit\u00e9 en ajustant la caract\u00e9ristique.<\/p>\n<p>Des caract\u00e9ristiques qui ajustent la toxicit\u00e9 d&rsquo;une IA<\/p>\n<p class=\"ed__a-p ed__bdy__l\"><img loading=\"lazy\" decoding=\"async\" src=\"data:image\/svg+xml,%3Csvg xmlns='http:\/\/www.w3.org\/2000\/svg'%3E%3C\/svg%3E\" draggable=\"false\" width=\"6240\" height=\"4160\" class=\"ed__title-xxs\" alt=\"ChatGPT est parfois toxique et malveillant et OpenAI a trouv\u00e9 le responsable\" style=\"background-color: #f2f2f2; aspect-ratio:6240\/4160;\"\/><\/p>\n<p>\u00a9 Shutterstock\/jackpress<\/p>\n<\/p>\n<p>        Publicit\u00e9, votre contenu continue ci-dessous<\/p>\n<p class=\"ed__a-p ed__bdy__l\">Les recherches permettent \u00e0 OpenAI de mieux saisir quels \u00e9l\u00e9ments poussent des mod\u00e8les \u00e0 agir de mani\u00e8re dangereuse dans le but de cr\u00e9er des chatbots plus s\u00fbrs.<\/p>\n<p class=\"ed__a-p ed__bdy__l\">Les chercheurs en IA savent comment am\u00e9liorer les mod\u00e8les mais, paradoxalement, ne savent pas toujours comment elles arrivent \u00e0 une certaine r\u00e9ponse. Une r\u00e9cente \u00e9tude men\u00e9e par Owain Evans, chercheur en IA \u00e0 Oxford, montre que les mod\u00e8les d\u2019OpenAI, quand ils sont ajust\u00e9s sur un code non s\u00e9curis\u00e9, adoptent des comportements malveillants. Notamment pour tromper un utilisateur ou lui demander de fournir son mot de passe.<\/p>\n<p class=\"ed__a-p ed__bdy__l\">Il s\u2019agit d\u2019un ph\u00e9nom\u00e8ne appel\u00e9 \u00ab\u00a0d\u00e9salignement \u00e9mergent\u00a0\u00bb et l\u2019\u00e9tude men\u00e9e par Owain Evans a inspir\u00e9 OpenAI pour approfondir ses recherches \u00e0 ce sujet. L\u2019entreprise a donc d\u00e9couvert des caract\u00e9ristiques qui jouent un r\u00f4le important dans le contr\u00f4le du comportement. Un peu comme l\u2019activit\u00e9 neuronale humaine quand des neurones sont connect\u00e9s \u00e0 des humeurs ou \u00e0 des comportements.<\/p>\n<p class=\"ed__a-p ed__bdy__l\">\u00ab\u00a0Quand Dan [Mossing, chercheur en interpr\u00e9tabilit\u00e9 chez OpenAI] et son \u00e9quipe ont pr\u00e9sent\u00e9 \u00e7a pour la premi\u00e8re fois lors d\u2019une r\u00e9union de recherche, je me suis dit : \u00ab\u00a0Wow, vous avez trouv\u00e9\u00a0\u00bb, d\u00e9clare Tejal Patwardhan, chercheuse en \u00e9valuation avanc\u00e9e chez OpenAI, lors d\u2019un entretien avec <a href=\"https:\/\/techcrunch.com\/2025\/06\/18\/openai-found-features-in-ai-models-that-correspond-to-different-personas\/\" target=\"_blank\" rel=\"nofollow noopener\">TechCrunch<\/a>. \u00ab\u00a0Vous avez trouv\u00e9 une activation neuronale interne qui montre ces personnalit\u00e9s, et vous pouvez r\u00e9ellement la diriger pour rendre le mod\u00e8le plus align\u00e9.\u00a0\u00bb<\/p>\n<p class=\"ed__a-p ed__bdy__l\">Des caract\u00e9ristiques d\u00e9couvertes par OpenAI sont connect\u00e9es au sarcasme et d\u2019autres \u00e0 des comportements toxiques. Les chercheurs pr\u00e9cisent que ces caract\u00e9ristiques changent parfois radicalement pendant le processus d\u2019ajustement appel\u00e9 \u00ab\u00a0fine-tuning\u00a0\u00bb.<\/p>\n<p class=\"ed__a-p ed__bdy__l\">Les chercheurs rassurent : quand un d\u00e9salignement survient, il est possible de ramener l\u2019IA \u00e0 un comportement correct en l\u2019ajustant sur quelques centaines d\u2019exemples de code s\u00e9curis\u00e9. OpenAI poursuit ses recherches pour comprendre comment ses propres mod\u00e8les fonctionnent, en plus de les am\u00e9liorer.<\/p>\n<p>        Publicit\u00e9, votre contenu continue ci-dessous<\/p>\n<p class=\"ed__a-p ed__bdy__l\">Envie de faire encore plus d\u2019\u00e9conomies ? D\u00e9couvrez <a href=\"https:\/\/www.lesnumeriques.com\/codes-promo.html\" rel=\"nofollow noopener\" target=\"_blank\">nos codes promo<\/a> s\u00e9lectionn\u00e9s pour vous.<\/p>\n","protected":false},"excerpt":{"rendered":"ChatGPT ChatGPT est le chatbot d\u2019OpenAI, bas\u00e9 sur le mod\u00e8le d\u2019intelligence artificielle GPT, permettant de r\u00e9pondre \u00e0 toutes&hellip;\n","protected":false},"author":2,"featured_media":194450,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[7],"tags":[1011,27,43,40,41,39,42,44],"class_list":{"0":"post-194449","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-sciences-et-technologies","8":"tag-fr","9":"tag-france","10":"tag-science","11":"tag-science-and-technology","12":"tag-sciences","13":"tag-sciences-et-technologies","14":"tag-technologies","15":"tag-technology"},"share_on_mastodon":{"url":"https:\/\/pubeurope.com\/@fr\/114723690216688632","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/posts\/194449","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/comments?post=194449"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/posts\/194449\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/media\/194450"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/media?parent=194449"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/categories?post=194449"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/tags?post=194449"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}