Впечатляющая новая система искусственного интеллекта от Google может генерировать музыку в любом жанре по текстовому описанию. Но компания, опасаясь рисков, не планирует его выпускать в ближайшее время.

Из отчета: Названная MusicLM, Google, безусловно, не первая система генеративного искусственного интеллекта для песни. Были и другие попытки, включая Riffusion, искусственный интеллект, который сочиняет музыку, визуализируя ее, а также Dance Diffusion, собственный AudioML от Google и Jukebox от OpenAI.

Но из-за технических ограничений и ограниченных данных для обучения ни один из них не смог создать песни особенно сложные по композиции или с высокой точностью воспроизведения. MusicLM, пожалуй, первый, кто может.

Как подробно описано в академической статье, MusicLM был обучен на наборе данных из 280 000 часов музыки, чтобы научиться генерировать связные песни для описаний, как выразились создатели, «значительной сложности» (например, «очаровательная джазовая песня с запоминающимся саксофоном»), соло и сольный певец »или« берлинское техно 90-х с низким басом и сильным ударом».

Его песни, что примечательно, звучат примерно так, как может сочинять человек-артист, хотя и не обязательно так изобретательно или музыкально связно.

Это не сказать, что MusicLM безупречен — это далеко не так, если честно. Некоторые сэмплы имеют искаженное качество, неизбежный побочный эффект тренировочного процесса.

И хотя MusicLM технически может генерировать вокал, включая хоровые гармонии, они оставляют многое для быть желанным.

Исследователи Google отмечают множество этических проблем, связанных с такой системой, как MusicLM, в том числе тенденцию включать защищенный авторским правом материал из обучающих данных в сгенерированные песни.