{"id":616735,"date":"2025-12-22T23:09:25","date_gmt":"2025-12-22T23:09:25","guid":{"rendered":"https:\/\/www.europesays.com\/fr\/616735\/"},"modified":"2025-12-22T23:09:25","modified_gmt":"2025-12-22T23:09:25","slug":"300-to-de-musique-annas-archive-revendique-avoir-aspire-le-catalogue-de-spotify","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/fr\/616735\/","title":{"rendered":"300 To de musique : Anna&rsquo;s Archive revendique avoir aspir\u00e9 le catalogue de Spotify"},"content":{"rendered":"<p>Connue pour agr\u00e9ger des millions de livres et d\u2019articles scientifiques pirat\u00e9s, la plateforme Anna\u2019s Archive annonce avoir r\u00e9alis\u00e9 une copie massive de la base de donn\u00e9es de Spotify. Au total : 86 millions de morceaux et des m\u00e9tadonn\u00e9es critiques, un piratage justifi\u00e9 au nom de la pr\u00e9servation num\u00e9rique.<\/p>\n<p>Cela ressemble fortement \u00e0 l\u2019un des plus gros braquages num\u00e9riques de ces derni\u00e8res ann\u00e9es, mais ses responsables pr\u00e9f\u00e8rent parler d\u2019un projet de sauvegarde de grande ampleur. Le 20 d\u00e9cembre 2025, les personnes en charge du site <a href=\"https:\/\/fr.wikipedia.org\/wiki\/Archive_d%27Anna\" target=\"_blank\" rel=\"noreferrer noopener\">Anna\u2019s Archive<\/a> \u2014 un moteur de recherche de biblioth\u00e8ques fant\u00f4mes bien connu des \u00e9tudiants, des chercheurs et des pirates \u2014 ont mis en ligne <a href=\"https:\/\/annas-archive.li\/blog\/backing-up-spotify.html\" target=\"_blank\" rel=\"noreferrer noopener\">un long billet de blog<\/a> pr\u00e9sentant leur derni\u00e8re prise de guerre.<\/p>\n<p>Cette fois, il n\u2019est pas question de documents en PDF ou de fichiers Epub. Le site affirme avoir \u00ab sauvegard\u00e9 Spotify \u00bb, et plus particuli\u00e8rement 256 millions de pistes musicales. On ne parle pas ici que des m\u00e9tadonn\u00e9es qui permettent de donner du contexte aux fichiers (artiste, dur\u00e9e, date, etc.) : on parle aussi des musiques elles-m\u00eames. En tout, l\u2019archive collect\u00e9e p\u00e8se aux alentours des 300 t\u00e9raoctets (To).<\/p>\n<p><a href=\"https:\/\/www.numerama.com\/wp-content\/uploads\/2025\/12\/anna-archive.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" width=\"1024\" height=\"833\" loading=\"lazy\" alt=\"Source : Anna's Archive\" title=\"Source : Anna's Archive\" class=\"wp-image-2147453 placeholder-default wp-image\" src=\"https:\/\/www.europesays.com\/fr\/wp-content\/uploads\/2025\/12\/anna-archive-1024x833.png\" \/><\/a>Source : Anna\u2019s Archive<\/p>\n<p>L\u2019op\u00e9ration, d\u00e9crite avec une pr\u00e9cision technique notable dans le billet de blog du 20 d\u00e9cembre, a abouti \u00e0 un chantier titanesque, si gros d\u2019ailleurs que le stockage par un particulier est improbable. \u00c0 titre de comparaison, l\u2019espace de stockage courant des ordinateurs r\u00e9cents tourne g\u00e9n\u00e9ralement entre 250 Go et 2 To. C\u2019est plut\u00f4t du c\u00f4t\u00e9 d\u2019un <a href=\"https:\/\/www.numerama.com\/tech\/1754578-quels-sont-les-meilleurs-serveurs-nas-a-acheter.html\" target=\"_blank\" rel=\"noopener\">bon serveur NAS<\/a> qu\u2019il faut se tourner, et encore.<\/p>\n<p>Jusqu\u2019\u00e0 pr\u00e9sent, Anna\u2019s Archive avait b\u00e2ti sa notori\u00e9t\u00e9 autour du texte, tels les livres et les articles. \u00ab Nous proc\u00e9dons ainsi parce que les textes ont la plus forte densit\u00e9 d\u2019informations. Mais notre mission (pr\u00e9server les connaissances et la culture de l\u2019humanit\u00e9) ne fait pas de distinction entre les types de supports. Parfois, une opportunit\u00e9 se pr\u00e9sente en dehors du domaine des textes. C\u2019est le cas ici. \u00bb, lit-on dans le message.<\/p>\n<p>Et cette fois, c\u2019est le g\u00e9ant su\u00e9dois du streaming musical qui s\u2019est retrouv\u00e9 dans le viseur du collectif anonyme.<\/p>\n<p>99,6 % des \u00e9coutes mondiales de Spotify aspir\u00e9es<\/p>\n<p>Dans le message d\u2019Anna\u2019s Archive, on apprend que l\u2019\u00e9quipe a trouv\u00e9 une astuce pour aspirer \u2014 scraper, dans le jargon \u2014 Spotify \u00e0 grande \u00e9chelle. Le r\u00e9sultat est \u00e9loquent : une base contenant les m\u00e9tadonn\u00e9es concernant 256 millions de chansons (soit 99,9 % du catalogue estim\u00e9 de la plateforme) et la r\u00e9cup\u00e9ration effective de 86 millions de fichiers audio. Soit un bon tiers de l\u2019ensemble des fichiers.<\/p>\n<p>Pourquoi ne pas avoir r\u00e9cup\u00e9r\u00e9 le reste ? D\u2019apr\u00e8s Anna\u2019s Archive, il s\u2019av\u00e8re que ces 86 millions de titres repr\u00e9sentent 99,6 % des \u00e9coutes r\u00e9elles sur la plateforme su\u00e9doise. En creux, il n\u2019apparaissait visiblement pas utile d\u2019aller prendre les 170 millions de titres restants vu le faible int\u00e9r\u00eat (0,4 %) qu\u2019ils suscitent. Anna\u2019s Archive a donc r\u00e9cup\u00e9r\u00e9 ce qui est vraiment \u00e9cout\u00e9, et a mis de c\u00f4t\u00e9 tout ce qui r\u00e9side dans les tr\u00e9fonds du service et qui ne g\u00e9n\u00e8re presque aucun stream.<\/p>\n<blockquote>\n<p>Une archive qui r\u00e9unit 99,6 % des \u00e9coutes r\u00e9elles de Spotify<\/p>\n<\/blockquote>\n<p>Pour g\u00e9rer cette masse de donn\u00e9es, et contenir autant que possible la taille de l\u2019archive finale, les responsables du projet ont reconnu avoir d\u00fb faire des compromis techniques. Ainsi, pour les titres assez populaires, leur format d\u2019origine (OGG Vorbis 160kbit\/s) a \u00e9t\u00e9 conserv\u00e9. Pour les autres, le choix a \u00e9t\u00e9 pris de les encoder \u00e0 nouveau en OGG Opus \u00e0 75kbit\/s pour \u00e9conomiser de l\u2019espace. Un audiophile est susceptible de d\u00e9celer la diff\u00e9rence, mais pas forc\u00e9ment le grand public.<\/p>\n<p>Selon Anna\u2019s Archive, son action fait \u0153uvre d\u2019utilit\u00e9 publique en offrant au \u00ab patrimoine musical de l\u2019humanit\u00e9 \u00bb une redondance lui permettant d\u2019\u00eatre \u00ab prot\u00e9g\u00e9 contre la destruction caus\u00e9e par les catastrophes naturelles, les guerres, les coupes budg\u00e9taires et les autres d\u00e9sastres \u00bb. Mais cette action sera naturellement tr\u00e8s mal vue aussi bien de Spotify que de tous les ayants droit musicaux, maisons de disques en t\u00eate.<\/p>\n<p>Du piratage\u00a0? De l\u2019archivage face au copyright, dit Anna\u2019s Archive<\/p>\n<p>Op\u00e9rationnel depuis fin 2022, et n\u00e9 en r\u00e9action aux <a href=\"https:\/\/www.numerama.com\/cyberguerre\/1368338-le-fbi-sattaque-encore-a-la-z-library.html\" target=\"_blank\" rel=\"noopener\">actions du FBI contre la Z-Library<\/a>, un site \u00e9quivalent qui <a href=\"https:\/\/www.numerama.com\/tech\/1117814-z-library-le-site-specialise-dans-les-livres-pirates-se-fait-bloquer-en-france.html\" target=\"_blank\" rel=\"noopener\">a notamment \u00e9t\u00e9 bloqu\u00e9 en France<\/a>, Anna\u2019s Archive brandit l\u2019argument de la pr\u00e9servation culturelle pour justifier ce qui est de toute \u00e9vidence une violation massive du droit d\u2019auteur \u2014 tout ceci se faisant en effet sans l\u2019accord manifeste des titulaires de droit.<\/p>\n<p>\u00ab De mani\u00e8re g\u00e9n\u00e9rale, la musique est d\u00e9j\u00e0 assez bien pr\u00e9serv\u00e9e. Il existe de nombreux passionn\u00e9s de musique dans le monde qui ont num\u00e9ris\u00e9 leurs collections de CD et de vinyles, les ont partag\u00e9es via des torrents ou d\u2019autres moyens num\u00e9riques, et les ont m\u00e9ticuleusement catalogu\u00e9es. Mais, ces efforts existants pr\u00e9sentent quelques probl\u00e8mes majeurs \u00bb, est-il avanc\u00e9.<\/p>\n<p><a href=\"https:\/\/www.numerama.com\/wp-content\/uploads\/2025\/09\/design-sans-titre-10.jpg\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" width=\"1024\" height=\"576\" loading=\"lazy\" alt=\"N\u00e9 \u00e0 Stockholm en 1983, Daniel Ek s\u2019int\u00e9resse tr\u00e8s t\u00f4t \u00e0 l\u2019informatique et fonde ses premiers projets d\u00e8s l\u2019adolescence. \/\/ Source : Lukasz Kobus\/European Commission \/ Numerama\" title=\"N\u00e9 \u00e0 Stockholm en 1983, Daniel Ek s\u2019int\u00e9resse tr\u00e8s t\u00f4t \u00e0 l\u2019informatique et fonde ses premiers projets d\u00e8s l\u2019adolescence. \/\/ Source : Lukasz Kobus\/European Commission \/ Numerama\" class=\"wp-image-2085733 placeholder-default wp-image\" src=\"https:\/\/www.europesays.com\/fr\/wp-content\/uploads\/2025\/12\/design-sans-titre-10-1024x576.jpg\" \/><\/a>Daniel Ek, le patron de Spotify, n\u2019a certainement pas d\u00fb appr\u00e9cier. \/\/ Source : Lukasz Kobus\/European Commission<\/p>\n<p>Le site pointe d\u2019une part l\u2019obsession des pirates m\u00e9lomanes pour la qualit\u00e9 sans perte FLAC (lossless), qui rend impossible le stockage de toute la musique mondiale sur des serveurs standards (les fichiers sont trop lourds), et d\u2019autre part l\u2019oubli quasi syst\u00e9matique des artistes peu connus. Enfin, il n\u2019y a pas de liste \u00ab officielle \u00bb de torrents visant \u00e0 repr\u00e9senter toute la musique jamais produite.<\/p>\n<p>D\u2019o\u00f9 la man\u0153uvre d\u2019Anna\u2019s Archive, qui se tient sur une ligne de conduite cens\u00e9e donner une valeur morale sup\u00e9rieure \u00e0 ce piratage par rapport aux consid\u00e9rations habituelles de la propri\u00e9t\u00e9 intellectuelle. C\u2019est un argument courant dans la mouvance du libre acc\u00e8s, \u00e0 l\u2019image de <a href=\"https:\/\/fr.wikipedia.org\/wiki\/Sci-Hub\" target=\"_blank\" rel=\"noreferrer noopener\">Sci-Hub<\/a> et <a href=\"https:\/\/fr.wikipedia.org\/wiki\/Library_Genesis\" target=\"_blank\" rel=\"noreferrer noopener\">LibGen<\/a> \u2014 <a href=\"https:\/\/www.numerama.com\/politique\/699072-pourquoi-sci-hub-et-libgen-se-font-encore-bloquer-par-les-fai-en-france.html\" target=\"_blank\" rel=\"noopener\">\u00e9galement cibl\u00e9s par des mesures de blocage<\/a>.<\/p>\n<p>La perspective du blocage d\u2019Anna\u2019s Archive<\/p>\n<p>Toutes ces donn\u00e9es sont diffus\u00e9es via le protocole BitTorrent, bien connu des adeptes du t\u00e9l\u00e9chargement illicite. Pour le moment, la propagation de ces informations a commenc\u00e9 par les m\u00e9tadonn\u00e9es. Par la suite, il est pr\u00e9vu la mise \u00e0 disposition des fichiers eux-m\u00eames, puis d\u2019autres m\u00e9tadonn\u00e9es, les couvertures des albums et enfin des fichiers techniques.<\/p>\n<p>Spotify n\u2019a, manifestement, pas encore officiellement r\u00e9agi et le silence semble pr\u00e9valoir pour l\u2019heure. La riposte judiciaire pourrait cependant arriver rapidement, peu apr\u00e8s la sortie du torrent incluant les fichiers musicaux. On n\u2019imagine pas, en effet, que l\u2019industrie musicale laisse se balader un fichier de 300 To contenant l\u2019essentiel de la musique sans rien dire.<\/p>\n<p>Le site pourrait notamment faire l\u2019objet de blocages devant les tribunaux \u2014 un type de sanction qu\u2019Anna\u2019s Archive connait bien, le site op\u00e9rant d\u00e9j\u00e0 dans l\u2019ill\u00e9galit\u00e9 (en raison de ses archives qui irritent les \u00e9diteurs scientifiques et litt\u00e9raires). Le site jongle d\u2019ailleurs avec les extensions de noms de domaine (.se, .li, .org) pour \u00e9chapper <a href=\"https:\/\/www.numerama.com\/tech\/746187-blocage-par-dns.html\" target=\"_blank\" rel=\"noopener\">aux blocages DNS ordonn\u00e9s par les tribunaux<\/a>. Cette pratique est courante, notamment, en France, o\u00f9 les FAI doivent r\u00e9guli\u00e8rement bloquer l\u2019acc\u00e8s \u00e0 ces sites.<\/p>\n<p>            <img decoding=\"async\" src=\"https:\/\/www.europesays.com\/fr\/wp-content\/uploads\/2025\/12\/iPhone-16-pro-vDJtn9o4_vzSsPIGCFDc5.png\" alt=\"Toute l'actu tech en un clien d'oeil\"\/><\/p>\n<p class=\"card-install-pwa__title\">Toute l&rsquo;actu tech en un clin d&rsquo;\u0153il<\/p>\n<p class=\"card-install-pwa__description\">Ajoutez Numerama \u00e0 votre \u00e9cran d&rsquo;accueil et restez connect\u00e9s au futur !<\/p>\n<p>            <img decoding=\"async\" src=\"https:\/\/www.numerama.com\/wp-content\/themes\/numerama-next\/dist\/images\/premium\/logo-card-pwa-coupe-vCvPQ_Q_ysBNfqKp6w7gG.svg\" alt=\"Logo PWA\"\/><\/p>\n<p>       Installer Numerama<\/p>\n<p class=\"title\">\n            Les derni\u00e8res actualit\u00e9s sur             <a href=\"https:\/\/www.numerama.com\/tag\/spotify\/\" target=\"_blank\" rel=\"noopener\"><br \/>\n                Spotify            <\/a>\n        <\/p>\n","protected":false},"excerpt":{"rendered":"Connue pour agr\u00e9ger des millions de livres et d\u2019articles scientifiques pirat\u00e9s, la plateforme Anna\u2019s Archive annonce avoir r\u00e9alis\u00e9&hellip;\n","protected":false},"author":2,"featured_media":616736,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[7],"tags":[72727,1011,27,43,40,41,39,6852,42,44],"class_list":{"0":"post-616735","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-sciences-et-technologies","8":"tag-bittorrent","9":"tag-fr","10":"tag-france","11":"tag-science","12":"tag-science-and-technology","13":"tag-sciences","14":"tag-sciences-et-technologies","15":"tag-spotify","16":"tag-technologies","17":"tag-technology"},"share_on_mastodon":{"url":"https:\/\/pubeurope.com\/@fr\/115765744771070584","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/posts\/616735","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/comments?post=616735"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/posts\/616735\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/media\/616736"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/media?parent=616735"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/categories?post=616735"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/fr\/wp-json\/wp\/v2\/tags?post=616735"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}