Des particuliers vendent désormais leur voix ou leur image à des entreprises pour entraîner des modèles d’IA. Un marché de l’identité en plein essor, porté par la pénurie de données des IA conversationnelles, mais qui n’est pas sans risques.

Un homme marche dans les rues bruyantes de Delhi, téléphone à la main. Il enregistre le trafic, les conversations, les klaxons. Chaque minute captée peut lui rapporter quelques centimes. A Chicago, un autre enregistre ses appels téléphoniques. Ailleurs, certains prêtent leur visage à des caméras ou lisent des textes à voix haute pendant des heures.

Selon une enquête du Guardian, ils sont aujourd’hui des milliers à monnayer ainsi leurs données personnelles pour entraîner des modèles d’intelligence artificielle.

Ces contributions répondent à un besoin pressant: les modèles d’IA conversationnels comme ChatGPT ou Gemini – qui nécessitent d’immenses volumes de données pour progresser – se heurtent aujourd’hui à une pénurie de ces dernières.

Pénurie de données pour les IA

En effet, les données « humaines » disponibles librement se raréfient ou deviennent juridiquement difficiles à exploiter. Les chercheurs estiment que les entreprises seront à court de textes récents et de haute qualité pour entraîner des modèles d’IA dès 2026. Dans ce contexte, les entreprises se tournent directement vers celles et ceux qui produisent des données, autrement dit les humains directement. 

Certaines plateformes proposent ainsi des missions simples comme lire des phrases à voix haute, enregistrer des bruits de fond, filmer des gestes du quotidien. D’autres vont plus loin, en demandant des interactions plus personnelles, comme enregistrer des échanges téléphoniques privés ou des conversations par SMS.

Ces données servent ensuite à créer des avatars numériques capables de parler, chanter ou interagir dans des contenus commerciaux ou des assistants vocaux.

Des données qui peuvent être détournées

Mais s’adonner à cette pratique n’est pas sans risque pour les utilisateurs et utilisatrices. Une fois la voix ou le visage enregistrés, ces derniers peuvent être réutilisés, modifiés et exploités pendant des années, souvent sans rémunération supplémentaire. En effet, les accords de licence que les contributeurs signent sont souvent irrévocables et sans redevances.

Structurellement, ce travail est précaire, non progressif et constitue en réalité une impasse

Mark Graham, professeur de géographie de l’internet à l’Université d’Oxford et auteur de « Feeding the Machine »

Ces données deviennent alors exploitables à large échelle. Dans les cas les plus extrêmes, elles peuvent servir à créer des deepfakes, à usurper l’identité des contributeurs ou encore à alimenter des contenus totalement sortis de leur contexte.

Le visage d’un utilisateur pourrait par exemple se retrouver dans une base de données de reconnaissance faciale ou dans une publicité malveillante à l’autre bout du monde, sans aucun recours légal.

Quelle rémunération?

La rémunération pour ce type de service reste faible, souvent quelques dollars pour plusieurs heures de travail. À Chicago, Ramelio Hill, un apprenti soudeur de 18 ans, confie au Guardian avoir gagné quelques centaines de dollars en vendant ses conversations téléphoniques privées avec ses proches à Neon Mobile, une plateforme de formation d’intelligence artificielle conversationnelle. Cette dernière rémunère 0,50$ la minute.

De son côté, Luel AI, soutenu par le célèbre incubateur de startups Y Combinator, propose aux gens d’enregistrer leurs conversations multilingues pour environ 0,15$ la minute.

En tant que Sud-Africain, être payé en dollars américains est plus avantageux qu’on ne le pense

Jacobus Louw, interrogé par The Guardian

En rémunérant directement les utilisateurs pour leur voix ou leur image, les entreprises spécialisées en intelligence artificielle cherchent aussi à se prémunir contre les litiges liés aux droits d’auteur. Ces données « humaines » leur permettent aussi de capter des nuances difficiles à reproduire artificiellement et d’affiner leurs modèles avec du contenu exclusif et de qualité.

Car comme le soulignent de nombreux spécialistes, la performance d’un être humain — dans la voix, le langage corporel ou les micro-expressions — reste, à ce stade, supérieure à ce que les systèmes d’IA peuvent générer.

Une réponse à des réalités économiques

Pour beaucoup, notamment dans les pays en développement, ce marché constitue une source de revenus dans un contexte économique précaire. Là où le chômage est élevé ou la monnaie dévaluée, être payé en dollars pour enregistrer sa voix ou filmer son quotidien peut offrir un semblant de stabilité. Ces micro-tâches permettent notamment de couvrir des dépenses essentielles ou de compléter des revenus insuffisants.

Dans The Guardian, Mark Graham, professeur de géographie de l’internet à l’Université d’Oxford et auteur de « Feeding the Machine », souligne que ces revenus peuvent être significatifs à court terme pour ces travailleurs. Mais il met en garde: « structurellement, ce travail est précaire, non progressif et constitue en réalité une impasse ».

Selon lui, les plateformes d’IA reposent sur une « course au moins-disant salarial » et sur une « demande temporaire de données humaines ». Lorsque cette demande évolue, « les travailleurs se retrouvent sans protection, sans compétences transférables et sans filet de sécurité ».

Au final, estime le spécialiste, les principaux bénéficiaires restent « les géants de la tech, qui captent l’essentiel de la valeur durable ».

Hélène Krähenbühl