📣 Anna’s Archive | 安娜的档案把 Spotify整个平台的音乐爬取了

🖼 标签:#AnnasArchive #Spotify #音乐档案 #安娜的档案馆 #数据存档 #Torrent #音乐

📱 简介:Anna’s Archive 最近做了一件听起来就很“过分”的事——成功爬取并备份了 Spotify 的绝大部分内容,不只是元数据,还包括音乐文件本身,规模直接拉到 8600 万首音乐文件2.56 亿条音轨记录1.86 亿个 ISRC,做成可查询的 SQLite 数据库,再用自家的 AAC 容器格式打包,通过 大体量 Torrent 分发,总量接近 300TB,这已经不是收藏,而是基础设施级别的存档

  更有意思的是它的爬取报告逻辑:37% 的歌曲量满足了 99.6% 的用户收听范围,热门曲目保留 OGG Vorbis 160kbps,而大量播放量为 0 的长尾音乐被转为 OGG Opus 75kbps 节省空间;数据分析也相当“冷静”,比如 70% 的歌曲播放量低于 1000、头部三首歌的播放量超过数千万首尾部曲目之和、整分钟时长存在异常峰值,以及近年大量疑似AI 生成音乐涌入平台——安娜报告里说得很直白,这不是为“最好听的音乐”建库,而是为人类音乐活动本身留底,不让它只剩算法和商业选择

  💬 小编有话说:安娜这波操作真6,书籍都弄那么多了,它再弄影音这块会不会被各国打击的更厉害了

🎵 原文与项目说明

😌频道 |🙂群聊 |🤓中文包 |🚇搜索
 
 
Back to Top