智东西
编译 庞小春
编辑 程茜
智东西5月11日消息,昨天,语音人工智能初创公司ElevenLabs发布了音乐生成人工智能模型的早期预览,能够根据文本提示,生成带有歌词的歌曲小样。
ElevenLabs由谷歌的前机器学习工程师皮奥特·达布科夫斯基(Piotr Dabkowski)和分析软件公司Palantir的前策略分析师马蒂·斯坦尼谢夫斯基(Mati Staniszewski),其音乐大模型可用于多种场景。但模型发布以来并未受到所有人的欢迎,不少人对其使用数据的原创性和使用方式表示担忧。
一、宣传策略模仿Sora,实时征集网友创意生成音乐
ElevenLabs擅于利用机器学习(ML)进行不同语言的语音克隆和合成,该公司已推出多种语音生成功能,包括文字转语音、语音变声器、配音等。不出所料,该公司已将目光投向了音乐产业。
为了提高模型知名度,ElevenLabs采用了萨姆·奥尔特曼(Sam Altman)在推出视频大模型Sora时的宣传方式,在社交媒体上对外征集创意,并将网友提供的文本转化为音乐。
目前尚未清楚此模型可以生成音乐的时间范围,但根据该公司设计主管阿玛尔·瑞希(Ammaar Reshi)在X上发布的示例,VentureBeat猜测此模型能够为三分钟的音乐作品生成歌词。
VentureBeat在报道中列举了一些音乐大模型的使用场景:生成一首有趣的摇篮曲哄孩子们入睡、为营销活动制作一首巧妙的广告歌曲、为播客节目设计一段活泼的音乐前奏等。外媒认为,一些人或许会使用这种模型来开发下一首热门歌曲,并称目前已经涌现出大量音乐人工智能创企,包括Harmonai、Lyrical Labs、Suno AI、Loudly等。
ElevenLabs于1月份推出了名为语音库的产品,用户可以通过语音库出售这些由人工智能生成的歌曲。目前,该公司的语音库已允许用户出售自己的人工智能克隆语音,公司会对其语音的可用范围进行控制。
二、训练数据版权受质疑,还可能被用于深度伪造
然而,音乐生成技术并非受到所有人的欢迎。与所有生成式人工智能应用程序一样,ElevenLabs的问题在于是在什么样的数据基础上训练此模型的,训练数据是否包含受版权保护的内容。如果包含,ElevenLabs是否获得了内容所有者的允许,或者这些内容是否受到了合理的保护。
还有一些反对音乐生成技术的人认为,艺术家可能会失业。人工智能将会轻松复制艺术家的风格,然后代替他们推出新音乐。此类技术也有可能被用来生产深度伪造品。VentureBeat已经联系了ElevenLabs,希望该公司能够就其音乐生成模型发表更多评论,并称如果收到回复会及时更新相关媒体报道。
结语:模型尚未成熟,既有机遇也有挑战
目前,ElevenLabs的音乐生成大模型仍处于早期预览版,但是已经展现出较大的潜力和影响力。它可以快速产出音乐作品,提高音乐制作的效率,但也有可能会对传统音乐人造成一定冲击。
音乐生成模型的出现,预示着音乐产业可能会经历一场由技术驱动的变革,既带来机遇也带来挑战。
来源:VentureBeat