你可能已经习惯通过ChatGPT、Gemini或Grok等生成式AI工具输入提示词,获取答案、图片甚至视频。而谷歌的Lyria 3则希望你用同样的方式来创作音乐。你可以输入文本提示,上传音频或图片,模型能在几秒钟内将这些想法转化为一首歌曲。
Lyria 3于今年2月发布,是谷歌最先进的音乐生成模型。3月,谷歌又推出了更高级的Lyria 3 Pro版本。
目前,像Suno和Udio这样的竞争对手已经在病毒式AI歌曲领域占据主导地位。谷歌希望通过Lyria 3和Lyria 3 Pro,打造更长、更高质量且结构更完善的音乐作品,抢占市场份额。
什么是Lyria 3?
Lyria 3是谷歌DeepMind最新的多模态音乐AI模型,支持文本、音频和图像等多种输入,能够根据视觉内容的情绪和节奏创作配乐。
该工具能生成高保真音乐,音符之间的过渡更自然,旋律、节奏和风格从头到尾保持一致。
Lyria 3集成在谷歌的Gemini AI计划中,付费用户和Lyria 3 Pro拥有更高的使用额度。Lyria 3 Pro已应用于Vertex AI、Google AI Studio、Gemini API、Google Vids、Gemini应用以及谷歌实验室的音乐创作平台ProducerAI。
ProducerAI不仅是一次性生成歌曲的工具,更像是创作伙伴,用户可以生成完整歌曲,也可以单独创作节拍、旋律或钩子,并持续调整。
如何开始使用Lyria
在Gemini中使用Lyria 3非常简单:描述你想要的歌曲类型,或上传一张图片,Gemini就能生成一段30秒的音乐,并配有AI生成的封面艺术。如果选择Thinking模型,还能生成更长的曲目。
在谷歌的开发者工具和云产品中,Pro模型能更好地处理歌曲结构,包括前奏、主歌、副歌、桥段和尾声。Gemini API中的Lyria 3剪辑模型支持生成30秒、48kHz立体声音频。
两个模型都支持对音乐元素的深度控制,用户可以指定复杂的音乐类型、乐器配置,甚至音色年代,比如“70年代模拟温暖音色”。
Lyria 3 Pro支持多轮编辑,允许用户在对话中持续迭代,但如果生成方向偏离,通常重新开始更高效。
提示词的艺术
Lyria 3的提示词是创作的关键。简单的关键词列表能生成歌曲,但谷歌建议使用以下框架来更好地控制模型:
[音乐类型和风格] + [情绪] + [乐器配置] + [节奏和速度] + [人声风格和语言] + [歌词]
你可以参考谷歌的详细提示指南,也可以让聊天机器人帮你生成提示词。
Futureproof音乐学校CEO John von Seggern指出,“文字和音乐并非一一对应,不能简单输入‘帮我做一首流行歌曲’,结果往往会偏离预期。”他认为,用户更适合用AI制作音乐的“构建模块”,而非完全依赖文字生成整首作品。
歌词与语言支持
Lyria 3支持英语、西班牙语、法语、德语、葡萄牙语、印地语、日语和韩语八种语言的歌词和人声生成。生成的声音富有情感色彩,符合所选音乐风格。
用户可以选择让AI根据主题自动创作歌词并演唱,或提供自定义歌词,并精确控制歌词在曲中的起止时间。
如果用英语输入指令,但希望歌曲用其他支持语言演唱,模型会自动翻译并调整人声表现,例如“制作一首韩语K-pop曲目”。

谁适合使用Lyria?
谷歌将Lyria 3定位为灵活的创作工具,而非仅供爱好者娱乐。最明显的应用场景是数字创作者和社交媒体影响者,用于短视频、播客、演示和社交内容的背景音乐。
John von Seggern表示,“它适合制作三分钟左右的YouTube视频背景音乐,非常实用。”
不过,他也提醒,想要精细控制音乐创作,用户需要具备一定的音乐知识。
谷歌还建议将其作为实验和教育工具,尤其适合缺乏乐器或资金支持的学生。
音乐质量如何?
网络上已经充斥大量低质量AI内容,音乐作为情感载体,对质量要求更高。Lyria 3的音质“相当不错”,但原创性方面略显平庸,缺乏独特性。
版权与归属问题
美国版权局2025年1月的报告指出,AI生成作品只有在有人类有意义的创意输入时才能获得版权,单靠提示词生成的作品不具备版权。
知识产权律师Relani Belous提醒,版权归属仍需具体判断,且发布AI作品前应充分了解相关条款和法律风险,必要时咨询专业律师。
目前已有独立音乐人起诉谷歌,指控其未经许可使用YouTube上至少4400万段音频和28万小时音乐训练Lyria 3。
谷歌回应称,训练数据均来自YouTube和谷歌有权使用的材料,符合服务条款和法律规定。
谷歌还在生成的音乐中嵌入了SynthID隐形水印技术,且Lyria 3 Pro设计避免模仿现有艺术家。
Belous指出,风格本身不可版权保护,但旋律和独特元素则可能涉及版权争议。她还强调,合理使用是版权法中的抗辩理由,而非免责权利。
AI音乐的未来
谷歌强调,AI应辅助而非取代人类创意。
格莱美获奖艺术家Wyclef Jean在创作《Back From Abu Dhabi》时使用了Lyria 3,他认为“人类有灵魂,AI有无限创造力,两者结合无敌”。
部分艺术家如Grimes愿意让AI使用其音乐进行训练或融合,但希望获得合理报酬。
2025年,Spotify曾下架一首冒充已故乡村歌手Blaze Foley的AI生成歌曲,显示出潜在的伦理和版权风险。
Belous认为,AI音乐领域存在大量不确定性和风险,相关许可协议和合同条款正在不断更新。
总体来看,Lyria 3技术先进,适用场景广泛,但音乐作为个人情感表达,AI音乐要想长期发展,必须超越无灵魂的背景噪音。


