DÉCRYPTAGE – Désormais, les IA se nourrissent de leurs propres productions. Entre contamination des données et homogénéisation du style, chercheurs et linguistes tirent la sonnette d’alarme.
Un nouveau danger, invisible mais omniprésent, plane pour les linguistes. Sur les blogs d’entreprises, les sites de conseil ou les pages de présentation commerciale, une langue étrangement lisse s’impose, marquée par l’absence de faute et des tournures impeccables. «Vous vous rendez bien compte en parcourant le Web qu’il y a des textes qui commencent à avoir un certain style», observe Guillaume Desagulier, professeur de linguistique anglaise à l’Université Bordeaux Montaigne. Ce style, c’est celui de l’intelligence artificielle générative, qui colonise progressivement l’espace numérique. Et avec elle, c’est tout un pan de la recherche linguistique qui se trouve menacé.
Le phénomène n’a rien d’anodin. Les grandes entreprises ont compris les économies qu’elles pouvaient réaliser en confiant la rédaction de leurs contenus à des algorithmes. Résultat : une masse croissante de textes artificiels inonde la toile. Or, ces mêmes textes servent à entraîner les modèles de langage de nouvelle…
Cet article est réservé aux abonnés. Il vous reste 89% à découvrir.
Vous avez envie de lire la suite ?
Débloquez tous les articles immédiatement.
Déjà abonné ?
Connectez-vous