
J’ai utilisé les données des débats de l’Assemblée nationale pour faire les nuages de mots des différents groupes (entre autres). Saurez-vous trouver qui est qui ? (détails en commentaire)

J’ai utilisé les données des débats de l’Assemblée nationale pour faire les nuages de mots des différents groupes (entre autres). Saurez-vous trouver qui est qui ? (détails en commentaire)
3 comments
J’ai fait ces nuages de mots pour l’analyse de données des débats parlementaires, car tous les comptes-rendus des débats sont en open data [ici](https://data.assemblee-nationale.fr/travaux-parlementaires/debats) !
Pour choisir les mots de chaque groupe j’utilise une formule inspirée de [TF-IDF](https://en.wikipedia.org/wiki/Tf%E2%80%93idf). En gros pour chaque groupe, j’associe un score à chaque mot qui dépend 1) du nombre d’utilisations 2) de la fréquence d’utilisation par rapport aux autres groupes et 3) de la longueur du mot (pour éliminer les mots de 2 ou 3 lettres). C’est le point 2) qui compte le plus dans le calcul, c’est-à-dire que les mots d’un groupe sont ceux que le groupe utilise beaucoup plus que les autres groupes en moyenne.
Si vous voulez plus de détails, j’ai fait un article complet sur cette page : [https://theo.delemazure.fr/blog/debats](https://theo.delemazure.fr/blog/debats)
. Il y contient aussi l’analyse des comportements entre groupes du genre quel groupe applaudit/proteste/hue le plus dans l’Assemblée ? Quels groupes sont applaudit par quels groupes ? Quels groupes applaudissent ensemble ?
C’est assez facile, et puis tu as mis les couleurs des partis
Et qu’est ce qu’ils ont en commun à se dire donc ?