過去幾年裏,人工智慧(AI)在創意領域的應用出現了爆炸性增長。新一代圖像和文本生成器不斷給人驚喜。現在,AI正在下一個領域掀起浪潮。
近期,谷歌的一個研究團隊發佈了新的AI模型MusicLM,這是一種可將文本信號轉換為音頻片段的音樂生成器。繼ChatGPT之後,音樂或將成為AI生成的前沿領域。這是創意AI在短短幾年內創新步伐飛速的又一個例子。
傳統音樂行業仍在適應網際網路和流媒體服務帶來的巨大衝擊,AI會改變人們創作和體驗音樂的方式,使音樂行業再次復興嗎?
把文字變音樂的AI“藝術家”
最近爆火的聊天機器人ChatGPT或許還無法製作音樂,但谷歌的MusicLM可以。
這一AI“藝術家”可根據不同地點、時代或要求創作音樂。其樣本由指定音樂流派、音樂氣氛甚至特定樂器的長段旋律組成。
當MusicLM“聽到”某人吹口哨、哼唱、演唱或是演奏樂器後,能從中推斷出額外的旋律小節。它可調節樂器的種類,甚至是演奏的力度。它還可創建一曲連續音樂即興表演的“故事”,例如創作“在電子遊戲中播放的電子歌曲”“在河邊播放的冥想歌曲”、表達意境為“火”和“煙花”等音樂。
MusicLM甚至可産生適合視覺藝術的聲音。例如,它根據薩爾瓦多·達利的名畫《記憶的永恒》和雅克-路易·大衛的《跨越阿爾卑斯山聖伯納隘道的拿破侖》的描述創建了配樂。
AI生成音樂史上的重要突破
AI生成音樂有著悠久的歷史,甚至被認為是創作熱門歌曲和助力現場表演的“功臣”。
在MusicLM之前,已經有其他嘗試利用AI生成音樂的嘗試,比如谷歌發佈的AudioML和OpenAI的Jukebox,視覺和聲音AI項目Riffusion則使用穩定擴散將文本提示轉換為聲圖。還有一些AI工具可將生成式AI和音樂結合在一起,比如Voicesmod的合成歌曲生成器,它可將提交的歌詞與一系列流行歌曲和AI聲音進行匹配。
不過,谷歌研究人員在論文中也提到了AI音樂生成面臨的各種挑戰。相比從文本到圖像的機器學習,缺乏配對的音頻和文本數據是一大障礙。此外,音樂是“沿著時間維度”構建的,讓AI了解文本表達的意圖,創作出一段符合主題的持續的音樂要困難得多。
MusicLM是克服挑戰的重要一步。據極客邦科技網站報道,MusicLM將有條件的音樂生成過程建模,變為分層序列到序列建模,也就是説,它使用機器學習為歌曲的不同層次生成序列,如結構、旋律和單獨的聲音,並在幾分鐘內以恒定的24千赫茲創建音樂。
AI會取代人類創作音樂嗎
目前,自動化創作音樂的技術已經在快速發展。AI工具可能會給藝術家提供更好的靈感。
但眾所週知,機器學習技術如同一個非常難以預測的“盲盒”。澳大利亞《對話》雜誌發文稱,使用AI生成音樂只是目前的一次“幸運的探險”。使用這些工具時,人們有時可能會發現黃金,但不知其中的原理是什麼。藝術家們現在不得不接受“潘多拉魔盒”已經被打開的現實,就像當初合成器和電子鼓第一次出現時一樣,在某些情況下,它可能會部分取代對音樂家的需求。
但目前,MusicLM還無法與人類作曲家匹敵,尤其是在歌詞創作方面。美國專注于語音智慧的線上媒體Voicebot.ai評論稱,MusicLM生成的歌詞充其量只是亂碼,甚至是在胡謅。谷歌研究人員也承認,MusicLM大約1%的創作內容只是在單一地複製現有的音樂。
因擔心版權風險以及道德問題,谷歌表示目前沒有立即發佈MusicLM的計劃。有法律版權專家表示,AI系統音樂可被視為衍生作品,在這種情況下,只有原創元素才會受到版權保護。不過,如果藝術家的作品在其不知情或未經他們同意的情況下被用來訓練AI系統,那麼AI音樂生成器還可能面臨涉及侵權的訴訟。如果沒有監管,這很可能成為音樂行業的另一個灰色地帶。