📣 Anna’s Archive | 安娜的档案把 Spotify整个平台的音乐爬取了🖼 标签:#AnnasArchive #Spotify #音乐档案 #安娜的档案馆 #数据存档 #Torrent #音乐
📱 简介:
Anna’s Archive 最近做了一件听起来就很“过分”的事——成功爬取并备份了 Spotify 的绝大部分内容,不只是元数据,还包括音乐文件本身,规模直接拉到
8600 万首音乐文件、
2.56 亿条音轨记录、
1.86 亿个 ISRC,做成可查询的
SQLite 数据库,再用自家的
AAC 容器格式打包,通过
大体量 Torrent 分发,总量接近
300TB,这已经不是收藏,而是基础设施级别的存档
更有意思的是它的爬取报告逻辑:
37% 的歌曲量满足了 99.6% 的用户收听范围,热门曲目保留
OGG Vorbis 160kbps,而大量播放量为 0 的长尾音乐被转为
OGG Opus 75kbps 节省空间;数据分析也相当“冷静”,比如
70% 的歌曲播放量低于 1000、头部三首歌的播放量超过数千万首尾部曲目之和、整分钟时长存在异常峰值,以及近年大量疑似
AI 生成音乐涌入平台——安娜报告里说得很直白,这不是为“最好听的音乐”建库,而是为
人类音乐活动本身留底,不让它只剩算法和商业选择
💬 小编有话说:安娜这波操作真6,书籍都弄那么多了,它再弄影音这块会不会被各国打击的更厉害了
🎵 原文与项目说明😌频道 |
🙂群聊 |
🤓中文包 |
🚇搜索