那支广告里的声音听起来温暖、自信,毫无疑问是个真人。它很可能真的是人——或者说,曾经是,在它变成训练数据之前。生成式语音 AI 有一手确实厉害的把戏:喂给它某个人几分钟的说话片段,它就能用那个人的音色、节奏与温度,生出好几个钟头的全新语音。这速度是真的。藏在里头的盲点也是真的——那个被学走声音的人,到底有没有点过头、说过一声好。
去问问 Paul Lehrman 和 Linnea Sage 吧。这两位专业配音员说,他们通过 Fiverr 接了活,对方告诉他们只是些小规模、低风险的工作——一个研究项目、几段测试用的广播稿。他们指控,这些「客户」其实是 AI 文字转语音公司 Lovo 的员工,公司拿这些录音做出合成声音,再用「Kyle Snow」和「Sally Coleman」这两个虚构名字卖给订阅用户。Lehrman 说,他后来在自己根本没录过的 YouTube 视频和播客里,撞见了自己的声音。在这宗拟提起的集体诉讼中,他们索赔至少 500 万美元;2025 年 7 月,纽约南区联邦法院的法官裁定,他们的形象权、违约与消费者保护等主张可以继续审理,但驳回了商标与大部分著作权的主张。此案仍属指控、尚在审理中,尚未认定任何责任。但这种伤害的轮廓,已经不再是假设。
就算一段录音都没被拷贝,光是「像」也足以引爆。2024 年 5 月,OpenAI 展示了一个叫「Sky」的 ChatGPT 声音,听众立刻把它和斯嘉丽·约翰逊在电影《她》里的演出相提并论。约翰逊公开表示,OpenAI 曾邀她替这个助理配音、她拒绝了,而当她听到一个「诡异地神似」自己的声音时,她感到「震惊」与「愤怒」。OpenAI 坚称 Sky 用的是另一位、早在接触她之前就选定的配音员——但在她的律师发出信函后,几天内就撤下了这个声音。从头到尾,没人证明发生过任何拷贝。而这正是重点所在:法律与商誉上的风险,挂在「让人联想到某个身份」这件事本身,而不是挂在一个被偷走的文件上。
这种根本上的草率,到底有多普遍?由 Julia Angwin 创办的调查媒体 Proof News,在 2024 年实测了八款商用语音克隆工具,结果发现:其中大多数,几乎或根本不去确认被克隆的那把声音,是不是来自一个同意的真人——很多工具要的,不过是勾一个方框。过去两年,美国配音员协会(NAVA)不断警告:声音被例行性地克隆、贩售,用途远远超出本人同意的范围;而英国 Equity 工会的法律顾问也描述了一种「令人不安的模式」——表演者把声音借给某个项目,回头却发现它被拿去某个自己从未许可的地方做商业利用。在这个市场里,所谓的「同意」,太常只是一个靠良心的勾选方框,而不是一件经过查证的事实。
立法者已经开始补上这道缺口。2024 年 3 月,田纳西州通过了《ELVIS 法案》——确保肖像、声音与形象安全法(Ensuring Likeness, Voice, and Image Security)——这是全美第一部明文把人格权延伸到「声音」的州法,涵盖「真实的声音或其模拟」,并于该年 7 月生效。加州紧接着推出 AB 1836 与 AB 2602,限制针对在世与已故表演者的数字复制。在联邦层面,跨党派的《NO FAKES 法案》于 2025 年重新提出,将首度建立一项联邦层面的权利,用以对抗未经授权、复制他人声音或肖像的数字分身,并要求托管平台承担下架义务。法律的风向正在快速转变——而它正转向那些在没人说好之前、声音就被拿去用的人。
以下这一点,买家最容易漏掉:风险并不会乖乖留在工具供应商那一边。当你投放一档活动,里头那把合成声音,是贴在你的品牌、跑在你的频道、挂在你的名字上。如果那把声音,是从一段说话者从未授权的录音学来的——又或者只是太过神似某个可辨识的真人——那么责任就可能顺流而下,落到广告主和代理商头上,而不只是那家生成它的 AI 公司。换句话说,来源(provenance)不是后台的小细节。它决定了你手上的,究竟是一项你拥有的资产,还是一笔你租来的负债。而在大多数语音克隆的流程里,买家根本无从证明这把声音从何而来——因为连供应商自己,往往都没查过。
而这,正是 Onyx Studios 当初成立要补上的那道缺口。我们声音库里的每一把声音,源头都是一个真实的人:他走进录音室,在明确授权下录音,并签下一份留存在案的买断合约。我们不爬数据、不把一段「研究用」的录音偷天换日变成商品,也不会交付一把只是「听起来像某个名人」的声音。我们的模式,会付费并署名给声音背后的那个人——接着,在每一份成品送到你手上之前,都由一位母语人士亲耳把关,这才是我们那句「AI 生成,真人把关(AI-Generated. Human-Perfected.)」在实务上真正的意思。生成式语音的速度,底下却没有那块「借来的身份」的盲点。
所以,两则邀请。如果你是配音员,这不必是一个「你的声音脱离你掌控」的故事——来和我们一起做,从你的同意、你的合约、以及你的名字出现在署名与支票上开始。如果你是品牌或代理商,请问出那个诉讼一再回到的问题:你的声音供应商,能不能证明声音背后那个人点过头、同意过?当答案是一份留存在案的签署合约,而不是一个勾选方框,你就不再是在租用风险,而是开始拥有一项资产。这就是我们站得住脚的来源——也是值得你站上去的那一种。
