Depuis quelques mois, des images virales de fruits à forme humaine générés par IA envahissent les réseaux sociaux, générant des centaines de milliers de vues. Derrière leur apparente innocence, certaines de ces vidéos dissimulent des messages sexistes ou racistes.
Une cerise aux traits fortement sexualisés est attablée dans un restaurant gastronomique face à un brocoli. Lui apparaît élégant, visiblement aisé et épris, tandis qu’elle adopte une posture plus distante, profitant du cadre très luxueux.
La vidéo, construite comme une mini-série, enchaîne ensuite des épisodes de leur relation tumultueuse. Après avoir demandé la femme en mariage, le personnage masculin multiplie les attentions, jusqu’à délaisser sa propre mère, présentée comme vulnérable. Son épouse, elle, est dépeinte comme vénale, mal intentionnée et manipulatrice.
>> Dans cette séquence générée par IA, la femme apparaît comme manipulatrice et vénale. :
Dans cette séquence générée par IA, la femme apparaît comme manipulatrice et vénale.
Ces mini-séries, aux accents de téléréalité et au fort pouvoir addictif, génèrent chaque jour des centaines de milliers de vues. Les femmes y apparaissent souvent comme infidèles, les mères négligentes, tandis que les maris apparaissent comme les victimes de ces manipulations. Les personnages pauvres sont représentés comme laids ou sales, contrastant avec des hommes riches, grands et puissants.
Les dialogues véhiculent aussi parfois des stéréotypes racistes: des personnages appelés « chocolato » sont tour à tour présentés comme des « sans-papiers » ou réduits à des attributs physiques, dans des échanges volontairement provocateurs et sexualisés.
Pourquoi ça fonctionne?
Le succès de ce type de vidéos, souvent fondées sur l’horreur, la tristesse ou l’indignation, s’inscrit dans une logique propre à Internet, où les contenus les plus choquants, absurdes ou déroutants sont ceux qui captent le plus l’attention.
« Le cerveau humain est davantage réceptif aux mauvaises nouvelles qu’aux bonnes. Et il reste en quête permanente de sensationnel », explique Donatas Smailys, PDG de la plateforme de marketing pour créateurs Billo, dans le New York Magazine. Dans ce contexte, les vidéos d’aliments « humanisés » activent tout simplement les ressorts les plus sensibles de notre cerveau.
Le cerveau humain est davantage réceptif aux mauvaises nouvelles qu’aux bonnes. Et il reste en quête permanente de sensationnel
Donatas Smailys, PDG de la plateforme de marketing pour créateurs Billo
Même si tous les créateurs et créatrices de ces vidéos ne revendiquent pas cette intention, certains reconnaissent adapter leurs contenus pour provoquer des réactions. C’est notamment le cas de Charles, étudiant français de 21 ans, qui s’est lancé dans la création de vidéos de ce type. Interrogé par BFM, il admet « s’adapter à ce que l’algorithme valorise ».
Comme beaucoup d’autres, sa démarche est avant tout guidée par des motivations financières. Une logique facilitée par les outils eux-mêmes. « Il existe une formule très précise pour créer ce type de contenu, et la création est sans limite ni contrainte (…) Chaque objet peut devenir un personnage », souligne Fana Yohannes, conseillère en stratégie numérique.
Un processus de création standardisé
Ces vidéos relèvent de ce que l’on appelle l' »AI slop », c’est-à-dire des contenus générés par intelligence artificielle, de qualité médiocre, facilement copiables et capables d’inonder internet. Tout est optimisé pour capter l’attention, au détriment de la valeur narrative ou artistique. La simplicité du visuel y joue un rôle clé.
Selon le New York Magazine, ces vidéos, dont l’esthétique rappelle celle des studios Pixar, reposent sur un processus de création standardisé: un personnage est d’abord généré via Object Talk, une version personnalisée de ChatGPT, puis animé à l’aide de plateformes spécialisées comme OpenArt.
Il existe une formule très précise pour créer ce type de contenu, et la création est sans limite ni contrainte
Fana Yohannes, conseillère en stratégie numérique
Concrètement, il suffit d’entrer le nom d’un aliment – par exemple un nugget de poulet – pour que l’outil produise une description détaillée d’un personnage en 3D, avec des traits anthropomorphisés (comme de petites dents en miettes ou de grands yeux brillants), accompagnée d’un court texte narratif prêt à être utilisé.
À l’origine, ces vidéos virales avaient surtout une vocation éducative. Ces contenus mettaient en scène des produits ménagers humanisés prodiguant des conseils pratiques, comme enlever une tache de vin ou prendre soin de sa peau. Mais ces contenus ont rapidement basculé vers des récits chargés d’émotions extrêmes – séparation, trahison, terreur -où le drame sert désormais de moteur principal à la viralité.
Hélène Krähenbühl