TLPL : le mec a pris chaque mot de madame de bovary, et les a classé par ordre alphabétique dans un bouquin…
> Selon le concepteur de l’ouvrage, dont on se demande toujours s’il plaisante ou pas, il a fallu “des puissants ordinateurs de l’armée française pour effectuer la mise en page, car même pour l’IA, la démarche était impossible à réaliser, car elle ne relève d’aucune logique”.
> 56 mois de travail
Hmmm
Bon l’objet est marrant. Mais pardon 56 mois de travail?
Mais entre trouver une édition complète de Madame Bovary sur le net (wikisource), l’export en txt, virer les notes et le dossier et un peu de gras. Et ranger les mots par ordre alphabétique de façon un peu “brute”. Ça m’a pris en tout et pour tout 5 minutes.
Bon après c’est sûr qu’il faut être certain de la qualité du document d’origine. Sans présumer aucunement l’effort de wikisource, j’ai le souvenir de certaines tentatives de mise en ligne de textes du Domaine Public où c’était bourré de coquilles (issu de scans automatisé + OCR). Mais trouver une édition critique reconnue, avec les bonnes variantes, corrections, etc… ça ne doit pas non plus prendre des masses de temps. Surtout avec le bon carnet d’adresse.
Plus un peu de manip avec un traitement de texte adéquat ou d’outils de dev c’est l’affaire de quelques minutes.
Voire d’une poignée d’heure pour “nettoyer” la remise en ordre alphabétique des mots du textes : notamment dans mon cas les lettrines était séparées du reste du mot. Et aussi rapidement tu remarques qu’il va falloir faire des choix : par exemple d’ + abord ou d’abord? ; quels signes typo on garde , . ; etc… quels signes on choisis d’écarter.
Et après un script automatisé pour compter les occurrences (probablement trouvable quelque part voire il y a déjà des outils dans tous les couloirs de recherche en littérature, voire directement dans les outils de traitement de texte/base de donnée.
Et enfin un autre script ou LaTeX pour traduire tout ça dans une belle mise en page.
C’est pas exactement dans mes compétences immédiates, mais 56 mois bordel, il a compté à la main?
Sur le plan démarche artistique, je crois que je préfère la banane scotchée au mur…
En guise de second commentaire :
Ça me rappelle une autre performance “stupidement inutile”, mais cette fois-ci à mon sens “artistiquement” plus intéressante :
Manque probablement un peu de traitement, par exemple les apostrophes vu que *qu’elle* et *elle* sont triés séparément.
Le tout avec de simples commandes unix dont la plus récente date de 1973.
Sur un thinkpad de 2017, time me compte 400 à 500ms de temps d’exécution. J’ai pris plus de temps à copier le fichier texte. Va falloir revoir le budget informatique de l’armée…
On dirait le deuxième exercice dans l’apprentissage de n’importe quel langage de programmation après print(‘Hello World!’).
8 comments
TLPL : le mec a pris chaque mot de madame de bovary, et les a classé par ordre alphabétique dans un bouquin…
> Selon le concepteur de l’ouvrage, dont on se demande toujours s’il plaisante ou pas, il a fallu “des puissants ordinateurs de l’armée française pour effectuer la mise en page, car même pour l’IA, la démarche était impossible à réaliser, car elle ne relève d’aucune logique”.
> 56 mois de travail
Hmmm
Bon l’objet est marrant. Mais pardon 56 mois de travail?
Mais entre trouver une édition complète de Madame Bovary sur le net (wikisource), l’export en txt, virer les notes et le dossier et un peu de gras. Et ranger les mots par ordre alphabétique de façon un peu “brute”. Ça m’a pris en tout et pour tout 5 minutes.
Bon après c’est sûr qu’il faut être certain de la qualité du document d’origine. Sans présumer aucunement l’effort de wikisource, j’ai le souvenir de certaines tentatives de mise en ligne de textes du Domaine Public où c’était bourré de coquilles (issu de scans automatisé + OCR). Mais trouver une édition critique reconnue, avec les bonnes variantes, corrections, etc… ça ne doit pas non plus prendre des masses de temps. Surtout avec le bon carnet d’adresse.
Plus un peu de manip avec un traitement de texte adéquat ou d’outils de dev c’est l’affaire de quelques minutes.
Voire d’une poignée d’heure pour “nettoyer” la remise en ordre alphabétique des mots du textes : notamment dans mon cas les lettrines était séparées du reste du mot. Et aussi rapidement tu remarques qu’il va falloir faire des choix : par exemple d’ + abord ou d’abord? ; quels signes typo on garde , . ; etc… quels signes on choisis d’écarter.
Et après un script automatisé pour compter les occurrences (probablement trouvable quelque part voire il y a déjà des outils dans tous les couloirs de recherche en littérature, voire directement dans les outils de traitement de texte/base de donnée.
Et enfin un autre script ou LaTeX pour traduire tout ça dans une belle mise en page.
C’est pas exactement dans mes compétences immédiates, mais 56 mois bordel, il a compté à la main?
Sur le plan démarche artistique, je crois que je préfère la banane scotchée au mur…
En guise de second commentaire :
Ça me rappelle une autre performance “stupidement inutile”, mais cette fois-ci à mon sens “artistiquement” plus intéressante :
Celle d’un artiste nantais qui a mis 30 ans à recopier à la main le dictionnaire (lequel? *en fait un Larousse de 1966*), illustrations comprises sur des feuilles de papier d’4m^2 : https://www.lemonde.fr/culture/article/2021/06/03/le-dictionnaire-detourne-de-gilles-barbier-expose-au-hangar-a-bananes-a-nantes_6082627_3246.html
https://inferno-magazine.com/2021/03/26/gilles-barbier-travailler-le-dimanche-hab-galerie-nantes/
Note : l’œuvre s’appelle “Travailler le Dimanche”
Des ordinateurs de l’armée française pour faire un tri alphabétique ? C’est un script de 15 lignes de code, 15 mn sur un Raspberry Pie…
Vite fait, une ligne de commande :
< bovary.txt tr ” ” “n” | tr “[:upper:]” “[:lower:]” | sort
Donc on prend le txt, on met tout en colonnes, tout en minuscules, on trie.
Pour avoir le nombre d’occurrences (trié croissant) :
< bovary.txt tr ” ” “n” | tr “[:upper:]” “[:lower:]” | sort | uniq -c | sort -n
Manque probablement un peu de traitement, par exemple les apostrophes vu que *qu’elle* et *elle* sont triés séparément.
Le tout avec de simples commandes unix dont la plus récente date de 1973.
Sur un thinkpad de 2017, time me compte 400 à 500ms de temps d’exécution. J’ai pris plus de temps à copier le fichier texte. Va falloir revoir le budget informatique de l’armée…
On dirait le deuxième exercice dans l’apprentissage de n’importe quel langage de programmation après print(‘Hello World!’).