Vue lecture

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.

Anna's Archive vient de sauvegarder la totalité de Spotify

Vous connaissez Anna's Archive , cette bibliothèque pirate qui sauvegarde tous les livres et articles scientifiques de l'humanité ? Hé bien ils viennent de s'attaquer à un nouveau chantier : sauvegarder Spotify (en tout cas le plus possible), c'est à dire des millions de morceaux + de la métadonnées, soit ~300 téraoctets de données !!

Anna's Archive se focalise normalement sur le texte (livres, et documents de recherche) parce que c'est ce qui a la plus haute densité d'information mais leur mission, c'est de préserver le savoir et la culture de l'humanité, et ça inclut donc aussi la musique. Et comme ils ont trouvé un moyen de scraper Spotify à grande échelle, ils se sont dit "Hey pourquoi pas ? On est des oufs".

Et ça donne la plus grande base de données de métadonnées musicales jamais rendue publique, avec 186 millions d'ISRCs uniques (ces codes qui identifient chaque enregistrement). Pour vous donner un ordre de grandeur, MusicBrainz n'en a que 5 millions. Niveau fichiers audio, ils ont aussi archivé environ 86 millions de morceaux, ce qui représente 99,6% des écoutes sur la plateforme (même si ça ne fait "que" 37% du catalogue total). Donc si vous écoutez un morceau au hasard sur Spotify, y'a 99,6% de chances qu'il soit dans l'archive.

Pour trier tout ça, ils ont utilisé la métrique "popularité" de Spotify qui va de 0 à 100. Ainsi, pour les morceaux avec une popularité supérieure à 0, ils ont récupéré quasiment tout en qualité originale (OGG Vorbis 160kbit/s) et pour les morceaux à popularité 0 (soit ~70% du catalogue, des trucs que personne n'écoute), ils ont réencodé en OGG Opus 75kbit/s pour gagner de la place… mais ils ne sont pas allés au bout de la longue traîne (trop de stockage pour trop peu de gain, et pas mal de contenu “bof” à popularité 0). Pour 99% des gens ça sonne pareil, même si je sais que les audiophiles vont me tuer dans les commentaires ^^.

En regardant les stats qu'ils ont produit à partir de ce qui a été scrappé, les 3 morceaux les plus populaires (Die With A Smile de Lady Gaga et Bruno Mars, BIRDS OF A FEATHER de Billie Eilish, et DtMF de Bad Bunny) ont été streamés plus de fois que les 20 à 100 millions de morceaux les moins populaires combinés. Bon, ils précisent aussi que la popularité est très dépendante du moment, donc ce top est un peu arbitraire mais ça montre à quel point la longue traîne est looooongue sur les plateformes de streaming...

Après le problème avec la préservation musicale actuelle (ce qu'on retrouve sur les sites de Torrent par exemple), c'est qu'elle se concentre uniquement sur les artistes populaires et la qualité maximale (FLAC lossless). Du coup, y'a plein de musique obscure qui ne survit que si une seule personne décide de la partager. Et ces fichiers sont souvent mal seedés. Et c'est pour ça que je trouve l'approche d'Anna's Archive plutôt pas mal car elle consiste à archiver tout ce qui existe (ou presque), même en qualité "suffisante", plutôt que de se concentrer sur un sous-ensemble en qualité parfaite.

Et comme vous vous en doutez, tout est distribué via des torrents, avec les métadonnées déjà disponibles (moins de 200 Go compressés) et les fichiers audio qui arrivent progressivement par ordre de popularité. Note la base s'arrête à juillet 2025, donc tout ce qui est sorti après peut ne pas être là (même s'il y a quelques exceptions).

Bref, c'est la première archive de préservation musicale vraiment ouverte, que n'importe qui peut mirrorer s'il a assez de stockage et voilà comment grâce à l'aide de tout le monde, le patrimoine musical de l'humanité sera protégé pour toujours des catastrophes naturelles, des guerres, des coupes budgétaires et autres désastres... Par contre, pas sûr que ça la protège de la boulimie des IA génératives.

Merci à Lilian pour l'info !

Source

Sega Channel - Le Game Pass de 1994 dont personne ne se souvient

Vous pensez que le streaming de jeux et les abonnements type Game Pass étaient des inventions récentes ? Que nenni mes mais, car en 1994, Sega avait déjà inventé ce concept quasiment tout pareil avec le Sega Channel, un service qui permettait de télécharger des jeux Mega Drive directement via le câble TV.

C'était y'a 30 ans quand même et pour en profiter, vous deviez brancher un adaptateur spécial dans le port cartouche de votre Mega Drive, vous le connectiez à votre prise de câble TV coaxial, et hop, vous aviez accès à une bibliothèque de 50 jeux qui évoluait chaque mois. Le tout pour environ 15 dollars par mois plus 25 dollars de frais d'activation et ensuite, les jeux étaient téléchargés dans les 4 Mo de RAM de l'adaptateur et effacés dès que vous éteigniez la console.

Ce service a été lancé le 12 décembre 1994 aux États-Unis via les câblo-opérateurs TCI et Time Warner Cable et Sega avec son optimisme légendaire espérait atteindre un million d'abonnés la première année. Ils en ont eu 250 000 ce qui n'est pas si mal, mais c'était loin des ambitions initiales alors que le marché potentiel était d'environ 20 millions de foyers américains.

Bref, tout ça c'est du passé mais pourtant, c'est pas tombé totalement dans l'oubli puisque la Video Game History Foundation vient de récupérer 144 fichiers ROM du service , dont une centaine de versions système uniques. Et surtout, ils ont retrouvé des jeux qu'on croyait perdus à jamais, comme "Garfield: Caught in the Act - The Lost Levels" et "The Flintstones" (Les Pierrafeu).

Ces titres n'existaient que sur Sega Channel et ont disparu quand le service a fermé... Certains jeux devaient aussi être modifiés pour tenir dans les limitations de l'adaptateur ce qui veut dire que les gros titres étaient découpés en plusieurs parties avec des systèmes de mots de passe pour empêcher les joueurs de sauter des niveaux. Pas très élégant, mais ça fonctionnait.

Quoiqu'il en soit, le service a tenu jusqu'au 31 juillet 1998, soit trois ans après la sortie de la Saturn et à la fin, il ne restait plus que 230 000 abonnés. Sega avait même prévu un successeur appelé Express Games, mais il n'a jamais vu le jour.

Ce qui est dommage c'est que d'après un sondage interne de l'époque, 99% des abonnés trouvaient le service pratique et 91% estimaient que c'était un bon rapport qualité-prix. Popular Science leur avait même filé un prix "Best of What's New" en 1994. Voilà, le concept était bon, mais c'était juste 20 ans trop tôt.

Bref, la prochaine fois que quelqu'un vous vante les mérites révolutionnaires du Game Pass ou du cloud gaming, en bon rabat joie, vous pourrez lui rappeler que Sega faisait déjà ça en 1994 avec un câble coaxial et 4 Mo de RAM.

❌