打一句话,等个二十秒,一首完整的歌就出来了——主歌、副歌,连歌手换气的位置都对。第一次听到时,真的像变魔术。速度是真的快,藏在里面的盲点也是真的:同一套能变出惊艳三十秒片段的系统,一旦你需要一首能挂在品牌后面、能卖、能播出的完整且可拥有的成品,就立刻变得脆弱。Suno 和 Udio 这类工具是了不起的点子机器,却是靠不住的制作伙伴,而这两者之间的落差,正是整篇文章的核心。
这些工具背后的气势,是挥之不去的。2026 年 Suno 完成由 Bond Capital 领投的 4 亿美元融资,公司估值来到 54 亿美元,比半年前才达到的 24.5 亿美元翻了一倍多。更早在同年,它就已突破 两百万付费订阅、年度经常性收入 3 亿美元。它的对手 Udio(由 Uncharted Labs 打造)则与环球音乐集团(UMG)和解了版权官司,并宣布要合作打造一个有授权的 AI 音乐服务。这不是一时热潮,而是一个带着真金白银与真实用户到来的新品类。
这些模型擅长的事,确实是全新的。给 Suno 一个情绪和一种曲风,它就回给你一段编排连贯、人声可信的成品;它的 v5 模型是第一个能稳定骗过一般听众耳朵的歌声,v5.5 更加上了带气音与颤音的细节,听起来符合该曲风。你可以打个广告短曲的草稿、为视频配乐试听五种方向,或在午餐前就听到自己只写了一半的歌词被唱出来。论头脑风暴、情绪参考、粗略 demo,音乐软件史上没有任何东西这么快、这么便宜。
一旦你需要精准,裂缝立刻显现。这些系统是先生成一首完成的立体声混音,再让你事后拆解,所以它交还给你的“分轨”其实是音源分离,而非真正的多轨——评测者经常反映鼓的分轨里渗进残留人声、人声轨上糊着乐器杂讯。资深制作人指出,Suno 对小节数、调性、曲式、速度这些制作基本面,仍无法稳定地听从指令。成品往往比商业发行的作品更小声、动态更平,而母带处理虽能让立体声文件更大声、更均衡,却无法把一件根本没有独立轨道的被埋乐器重新调平。
接着是决定你到底能不能用这段音乐的关键问题:它是谁的?美国版权局(U.S. Copyright Office)2025 年的指引说得很直白——光靠提示词,并不构成足够的人类控制,不足以让使用者成为产出的作者——这意味着一首你纯粹靠打指令生成的歌,可能根本无法取得版权,在你最需要保护时反而毫无保障。版权只会附着在人类有实质塑造的部分,例如你写的歌词、或你重新编排过的部分。对一个需要干净、站得住脚的权利的品牌或视频来说,“大概无法取得版权”并不是能盖房子的地基。
法律阴影比产出本身更深。2024 年,各大唱片公司通过美国唱片业协会(RIAA)同时起诉 Suno 与 Udio,指控其模型大规模使用受版权保护的录音来训练——并举出据称与玛丽亚·凯莉〈All I Want for Christmas〉等歌曲雷同的产出,甚至冒出真实的制作人标记。Udio 此后与环球音乐集团达成和解与授权安排,但在过渡期,它的产品变成一座围墙花园——连它自家 CEO 都承认,使用者甚至无法下载自己做出来的曲子,这是“重大的牺牲”。据报道,与其他唱片公司的诉讼仍在进行。这一切都尚未尘埃落定,而“尚未落定”是个很难拿来交付成品的处境。
这正是真人音乐家补上的那道缺口——也正是 Onyx Studios 围绕着打造的核心。工作室的理念“AI-Generated. Human-Perfected.(AI 生成,人手臻于完美)”,把生成器的产出当成起始草稿,而非交付物。真人编曲者会修好模型搞砸的曲式、调性与速度;录音工作会把演奏收进各自干净的轨道,让混音与母带能真正发挥作用,而不是替一个已经烤死的立体声文件打补丁;而且每一份贡献,对于“这是谁的?”这个问题,都能给出一个品牌法务真正能接受的答案。
Onyx Live Strings 是这个差异最清楚的例子。当生成器只能给你一块在法律上抓不住的合成弦乐铺底,Onyx 则在录音间里收录真正的弦乐团——乐手、琴弓、空气感——并把成果连同已清权、可发行的权利一起交付。这正是那个魔法盒子至今还卖不了你的东西:一份你完全拥有、能直接播出的完成母带。用 Suno 和 Udio 尽情发想、快速找到点子;然后把它带给能把它变成你真正能上线的音乐的人。
