《大西洋月刊》发布用于AI训练的音乐数据库

图片: The Verge
简要回答
《大西洋月刊》的记者发布了一个包含2100万首用于AI训练的音乐曲目的可搜索数据库。
《大西洋月刊》记者亚历克斯·赖斯纳发布了一项调查结果,发现了四个用于训练人工智能模型的大型数据集。最大的两个数据集包含1200万和900万首音乐曲目,另外两个数据集则各包含超过10万首音乐作品。赖斯纳表示,这些数据库已被下载数千次,谷歌和Stability AI等公司已确认使用这些数据。
尽管这些数据集在互联网上可用,但其使用涉及技术和法律上的复杂性。四个数据集中有三个是YouTube和Spotify上的音乐链接列表,而非现成的音频文件。开发者使用自动化工具下载音乐,绕过平台的保护机制,包括身份验证和广告拦截。这违反了服务条款,并剥夺了内容创作者的潜在收入。
法律层面也引发了问题。例如,Free Music Archive允许免费试听曲目,但商业使用需要许可。未经版权所有者同意使用这些数据可能导致法律纠纷,特别是当AI模型生成与受版权保护的作品相似的音乐时。
常见问题
- 哪些公司使用这些音乐数据库进行AI训练?
- 谷歌和Stability AI已确认在其研究中使用了类似的数据集。然而,由于数据库已被下载数千次,具体使用这些数据的公司名单尚不清楚。
- 为什么使用这些数据会引发争议?
- 许多曲目通过YouTube和Spotify传播,但未遵守许可协议。自动化工具绕过平台保护机制,剥夺了创作者的收入,并违反了服务条款。
- 这些数据是否可以合法用于商业项目?
- 不能,大多数曲目在商业使用时需要许可。例如,Free Music Archive允许免费试听,但未经版权所有者同意,禁止商业使用。
分享:
Dzen 订阅: /feed/dzen.xml · RSS: /feed.xml