Google a officialisé le 2 février dernier le lancement de WAXAL, une vaste base de données vocales ouverte, destinée à accélérer les technologies de la parole dans 21 langues d’Afrique, à savoir l’Acholi, l’Akan, le Dagaare, le Dagbani, le Dholuo, l’Ewe, le Fante, le Fulani (Fula), le Hausa, l’Igbo, l’Ikposo (Kposo), le Kikuyu, le Lingala, le Luganda, le Malgache, le Masaaba, le Nyankole, le Rukiga, le Shona, le Soga (Lusoga), le Swahili et le Yoruba). Son nom, emprunté au Wolof, signifie « Parler ».

Consortium africain

Développée sur trois ans, cette initiative revendique plus de 11 000 heures d’audio, issues de près de deux millions d’enregistrements individuels. Parmi ceux-ci, Google distingue environ 1 250 heures soigneusement transcrites pour l’entraînement des systèmes de reconnaissance automatique de la parole, et plus de 20 heures d’enregistrements studio destinées à la synthèse vocale de haute fidélité. Sur le plan opérationnel, WAXAL s’appuie sur un consortium d’acteurs africains, dont l’Université Makerere et l’University of Ghana, qui ont piloté la collecte pour 13 langues, tandis que Digital Umuganda au Rwanda a coordonné le travail pour 5 langues majeures, avec l’appui d’autres partenaires pour les séances en studio.

« Pour les enregistrements vocaux de haute qualité, nous avons collaboré avec les experts régionaux de Media Trust et Loud n Clear. Nous avons également établi un partenariat avec l’Institut africain des sciences mathématiques (AIMS) pour la collecte de données multilingues destinées aux prochaines versions », déclare Google. La base de données complète est publiée sous licence ouverte et accessible à tous sur la plateforme Hugging Face.

Un intérêt croissant

Cette annonce ne constitue pas un coup isolé, mais s’inscrit dans une trajectoire plus large où Google équipe progressivement ses produits et ses modèles d’intelligence artificielle pour mieux prendre en charge les langues africaines, à l’écrit comme à l’oral. En 2025, l’entreprise a lancé un projet visant à développer et à normaliser un glossaire de 100 termes d’IA et leurs définitions dans 4 langues africaines, en commençant par le swahili pour l’Afrique de l’Est, l’afrikaans, xhosa et l’isiZulu pour l’Afrique du Sud. En 2024, elle a fait de la voix un axe prioritaire en ajoutant 15 langues africaines à ses services de recherche vocale, de saisie vocale sur Gboard et de dictée sur Translate, visant ainsi près de 300 millions de personnes supplémentaires.

La même année, elle a procédé à un élargissement massif de Google Translate, ajoutant 110 langues grâce à l’IA, dont un quart environ originaires d’Afrique. Cette vague, présentée comme la plus grande intégration de langues africaines à ce jour sur le service, s’appuyait déjà sur le modèle PaLM 2 pour apprendre plus rapidement des langues apparentées. En filigrane, ces annonces successives marquent une bascule stratégique : Google ne veut plus seulement traduire les langues africaines, mais les faire exister pleinement dans l’écosystème global de l’IA, de la voix.

Une diversité d’enjeux

Pour Google, les enjeux sont multiples. Il s’agit d’abord d’élargir l’internet « adressable » en rendant ses services accessibles via la voix, une porte d’entrée souvent plus naturelle que l’écrit dans de nombreux contextes, élargissant ainsi son bassin d’utilisateurs et ses possibilités de monétisation. Ensuite, l’entreprise sécurise une ressource rare et précieuse : la donnée linguistique de qualité, essentielle pour entraîner les modèles de reconnaissance et de synthèse vocale. Dans la compétition mondiale de l’IA, maîtriser les langues dites « peu dotées » est devenu un terrain de différenciation stratégique, permettant de gagner des parts d’usage et de renforcer tout un écosystème.

Enfin, à travers des partenariats universitaires, des publications en open data et des programmes nationaux, Google consolide son soft power et son ancrage technologique stratégique sur le continent, acquérant une influence certaine dans l’élaboration des politiques numériques locales. Pour l’Afrique, ces initiatives présentent aussi des opportunités concrètes, à condition que la valeur générée soit captée localement. Elles peuvent favoriser l’inclusion numérique en permettant à des populations moins familières aux langues étrangères ou à l’écrit d’accéder à la recherche, à la dictée ou à la traduction. Le jeu de données ouvert WAXAL peut aussi accélérer l’émergence d’un tissu dynamique de start-up et de laboratoires de recherche, en réduisant les coûts d’entrée pour créer des applications dans des secteurs clés comme la santé, l’agriculture ou les services publics.

Sur un plan culturel, cette mise en données peut, si elle est menée de manière éthique, contribuer à la préservation et à la valorisation des langues, en facilitant leur documentation et en soutenant leur usage numérique. Enfin, le développement d’outils éducatifs en langues locales, alimentés par l’IA, porte la promesse d’améliorer les apprentissages, particulièrement dans les zones rurales où l’enseignement dans une langue étrangère est plus contraignant que dans les langues maternelles.

Prendre des précautions

Cependant, ces projets ne sont pas exempts de craintes. La question de la souveraineté et de la capture de la valeur se pose avec acuité : même avec des données ouvertes et des partenariats affichés, qui transformera réellement ces ressources linguistiques en produits, revenus et brevets dominants ? Le risque d’une forme d’exploitation de « matières premières » persiste, où le continent fournirait les données sans bénéficier pleinement des retombées économiques et technologiques. Ce risque d’exploitation fait planer le spectre d’une dépendance technologique et d’une asymétrie d’accès.

Si les langues africaines arrivent d’abord dans les applications grand public de grandes plateformes, mais qu’elles restent difficilement accessibles via des interfaces développeurs pour les innovateurs locaux, l’écosystème africain pourrait rester spectateur plutôt qu’acteur de sa propre transformation numérique. La promesse d’inclusion doit donc être constamment confrontée à cette question fondamentale : qui en profite réellement ?