The Atlantic опубликовал базу данных музыки для обучения ИИ

Фото: The Verge
Краткий ответ
Журналисты The Atlantic выложили в открытый доступ поисковую базу из 21 млн музыкальных треков, используемых для обучения ИИ.
Журналист The Atlantic Алекс Рейснер опубликовал результаты расследования, в ходе которого были обнаружены четыре крупных набора данных, используемых для обучения моделей искусственного интеллекта. Самые объемные коллекции содержат 12 и 9 миллионов музыкальных треков, а два других набора — более 100 тысяч композиций каждый. По словам Рейснера, эти базы уже загружены тысячи раз, а их применение подтвердили такие компании, как Google и Stability AI.
Несмотря на доступность данных в интернете, их использование сопряжено с техническими и юридическими сложностями. Три из четырех наборов представляют собой списки ссылок на треки в YouTube* и Spotify*, а не готовые аудиофайлы. Для скачивания музыки разработчики применяют автоматизированные инструменты, которые обходят защиту платформ, включая авторизацию и рекламные блоки. Это нарушает условия использования сервисов и лишает авторов контента потенциальных доходов.
Правовые аспекты также вызывают вопросы. Например, набор Free Music Archive разрешает бесплатное прослушивание треков, но требует лицензирования для коммерческого использования. Применение таких данных без согласия правообладателей может привести к судебным разбирательствам, особенно если ИИ-модели начнут генерировать музыку, похожую на защищенные авторским правом произведения.
Частые вопросы
- Какие компании используют эти музыкальные базы для обучения ИИ?
- Google и Stability AI подтвердили использование подобных наборов данных в своих исследовательских работах. Однако точный список всех компаний неизвестен, так как базы скачивались тысячи раз.
- Почему использование этих данных вызывает споры?
- Многие треки распространяются через YouTube* и Spotify* без соблюдения лицензионных соглашений. Инструменты для автоматического скачивания обходят защиту платформ, лишая авторов доходов и нарушая условия сервисов.
- Можно ли легально использовать эти данные для коммерческих проектов?
- Нет, большинство треков требуют лицензирования для коммерческого использования. Например, набор Free Music Archive разрешает бесплатное прослушивание, но не коммерческое применение без согласия правообладателей.
Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml