打一句話,等個二十秒,一首完整的歌就出來了——主歌、副歌,連歌手換氣的位置都對。第一次聽到時,真的像變魔術。速度是真的快,藏在裡面的盲點也是真的:同一套能變出驚艷三十秒片段的系統,一旦你需要一首能掛在品牌後面、能賣、能播出的完整且可擁有的成品,就立刻變得脆弱。Suno 和 Udio 這類工具是了不起的點子機器,卻是靠不住的製作夥伴,而這兩者之間的落差,正是整篇文章的核心。
這些工具背後的氣勢,是揮之不去的。2026 年 Suno 完成由 Bond Capital 領投的 4 億美元募資,公司估值來到 54 億美元,比半年前才達到的 24.5 億美元翻了一倍多。更早在同年,它就已突破 兩百萬付費訂閱、年度經常性收入 3 億美元。它的對手 Udio(由 Uncharted Labs 打造)則與環球音樂集團(UMG)和解了版權官司,並宣布要合作打造一個有授權的 AI 音樂服務。這不是一時熱潮,而是一個帶著真金白銀與真實用戶到來的新品類。
這些模型擅長的事,確實是全新的。給 Suno 一個情緒和一種曲風,它就回給你一段編排連貫、人聲可信的成品;它的 v5 模型是第一個能穩定騙過一般聽眾耳朵的歌聲,v5.5 更加上了帶氣音與顫音的細節,聽起來符合該曲風。你可以打個廣告短曲的草稿、為影片配樂試聽五種方向,或在午餐前就聽到自己只寫了一半的歌詞被唱出來。論腦力激盪、情緒參考、粗略 demo,音樂軟體史上沒有任何東西這麼快、這麼便宜。
一旦你需要精準,裂縫立刻顯現。這些系統是先生成一首完成的立體聲混音,再讓你事後拆解,所以它交還給你的「分軌」其實是音源分離,而非真正的多軌——評測者經常回報鼓的分軌裡滲進殘留人聲、人聲軌上糊著樂器雜訊。資深製作人指出,Suno 對小節數、調性、曲式、速度這些製作基本面,仍無法穩定地聽從指令。成品往往比商業發行的作品更小聲、動態更平,而母帶處理雖能讓立體聲檔案更大聲、更均衡,卻無法把一件根本沒有獨立軌道的被埋樂器重新調平。
接著是決定你到底能不能用這段音樂的關鍵問題:它是誰的?美國版權局(U.S. Copyright Office)2025 年的指引說得很直白——光靠提示詞,並不構成足夠的人類控制,不足以讓使用者成為產出的作者——這意味著一首你純粹靠打指令生成的歌,可能根本無法取得版權,在你最需要保護時反而毫無保障。版權只會附著在人類有實質塑造的部分,例如你寫的歌詞、或你重新編排過的部分。對一個需要乾淨、站得住腳的權利的品牌或影片來說,「大概無法取得版權」並不是能蓋房子的地基。
法律陰影比產出本身更深。2024 年,各大唱片公司透過美國唱片業協會(RIAA)同時控告 Suno 與 Udio,指控其模型大規模使用受版權保護的錄音來訓練——並舉出據稱與瑪麗亞·凱莉〈All I Want for Christmas〉等歌曲雷同的產出,甚至冒出真實的製作人標記。Udio 此後與環球音樂集團達成和解與授權安排,但在過渡期,它的產品變成一座圍牆花園——連它自家執行長都承認,使用者甚至無法下載自己做出來的曲子,這是「重大的犧牲」。據報導,與其他唱片公司的訴訟仍在進行。這一切都尚未塵埃落定,而「尚未落定」是個很難拿來交付成品的處境。
這正是真人音樂家補上的那道缺口——也正是 Onyx Studios 圍繞著打造的核心。工作室的理念「AI-Generated. Human-Perfected.(AI 生成,人手臻於完美)」,把生成器的產出當成起始草稿,而非交付物。真人編曲者會修好模型搞砸的曲式、調性與速度;錄音工作會把演奏收進各自乾淨的軌道,讓混音與母帶能真正發揮作用,而不是替一個已經烤死的立體聲檔案打補丁;而且每一份貢獻,對於「這是誰的?」這個問題,都能給出一個品牌法務真正能接受的答案。
Onyx Live Strings 是這個差異最清楚的例子。當生成器只能給你一塊在法律上抓不住的合成弦樂鋪底,Onyx 則在錄音間裡收錄真正的弦樂團——樂手、琴弓、空氣感——並把成果連同已清權、可發行的權利一起交付。這正是那個魔法盒子至今還賣不了你的東西:一份你完全擁有、能直接播出的完成母帶。用 Suno 和 Udio 盡情發想、快速找到點子;然後把它帶給能把它變成你真正能上線的音樂的人。
