Bad Bunny、Taylor Swift 等超过 2100 万艺人歌曲被秘密用来训练 AI
《大西洋月刊》调查起底:有哪些受版权保护的歌曲,正悄悄成为各大生成式 AI 音乐平台的训练引擎。
一项由《The Atlantic》主导的调查揭露了支撑多个生成式 AI 音乐平台背后、庞大的资料抓取规模。这篇由撰稿人 Alex Reisner 撰写的报导,详述 4 组资料库的发现,当中约收录 2,120 万首用于模型训练的曲目,其中最大的一个档案库单独就包含 1,200 万首歌曲,另一个则有 900 万首。这些纪录让权利人得以查证,开发者是否曾擅自使用其作品,来打造可模拟真人演奏与演唱的服务。可搜寻的资料库进一步确认,其中收录了 Taylor Swift、Bad Bunny、Billie Eilish 及 Nirvana 等知名音乐人的作品。
这次揭露,正值音乐产业全力对抗未经授权的 AI 生成内容的关键时刻。许多生成式 AI 公司往往援引「合理使用」作辩护,声称以现有作品训练模型不会损害原有市场。如今曝光的资料库则动摇了这种说法,因为它清楚呈现出,要输出具有商业价值的「分身」作品,究竟使用了哪些受版权保护的素材。Spotify、Deezer 等串流平台早已难以消化如潮涌入的人工音源,Deezer 更透露,其每日上架内容中,近半数皆为 AI 生成。
这些具体发现,将直接影响多宗备受关注的科技公司诉讼。Universal Music Group 与 Sony Music Entertainment 目前正就 AI 平台 Suno 涉嫌大规模侵权提起诉讼。两家唱片公司最近已向联邦法院申请,将追加超过 61,000 首录音作品纳入诉状,原因是他们已在训练资料中确认自家资产遭到使用。Suno 先前亦承认,为建立其服务,曾让系统接触过数以千万计的不同录音。
如今,法院必须裁定,这种大规模撷取究竟属于具转化性的使用,还是赤裸裸的盗版行为。科技界以往的相关诉讼,例如「Bartz v. Anthropic」等版权案件,正凸显创作者与 AI 开发者之间持续升温的角力。《The Atlantic》整理出的详尽证据,让音乐人得以具体理解,那些能复制其招牌声线与风格的工具,背后实际运作的机制。这种资讯透明,有效撕开 AI 公司一贯维持的神秘面纱,亦为数码音乐生态的责任追究树立全新标准。



















