下一個AI顛覆性應用發生在音樂領域？

發佈時間：2023-02-13 16:43:22 | 來源：科技日報 | 作者：張佳欣 | 責任編輯：徐麗麗

過去幾年裏，人工智慧（AI）在創意領域的應用出現了爆炸性增長。新一代圖像和文本生成器不斷給人驚喜。現在，AI正在下一個領域掀起浪潮。

近期，谷歌的一個研究團隊發佈了新的AI模型MusicLM，這是一種可將文本信號轉換為音頻片段的音樂生成器。繼ChatGPT之後,音樂或將成為AI生成的前沿領域。這是創意AI在短短幾年內創新步伐飛速的又一個例子。

傳統音樂行業仍在適應網際網路和流媒體服務帶來的巨大衝擊，AI會改變人們創作和體驗音樂的方式，使音樂行業再次復興嗎？

把文字變音樂的AI“藝術家”

最近爆火的聊天機器人ChatGPT或許還無法製作音樂，但谷歌的MusicLM可以。

這一AI“藝術家”可根據不同地點、時代或要求創作音樂。其樣本由指定音樂流派、音樂氣氛甚至特定樂器的長段旋律組成。

當MusicLM“聽到”某人吹口哨、哼唱、演唱或是演奏樂器後，能從中推斷出額外的旋律小節。它可調節樂器的種類，甚至是演奏的力度。它還可創建一曲連續音樂即興表演的“故事”，例如創作“在電子遊戲中播放的電子歌曲”“在河邊播放的冥想歌曲”、表達意境為“火”和“煙花”等音樂。

MusicLM甚至可産生適合視覺藝術的聲音。例如，它根據薩爾瓦多·達利的名畫《記憶的永恒》和雅克-路易·大衛的《跨越阿爾卑斯山聖伯納隘道的拿破侖》的描述創建了配樂。

AI生成音樂史上的重要突破

AI生成音樂有著悠久的歷史，甚至被認為是創作熱門歌曲和助力現場表演的“功臣”。

在MusicLM之前，已經有其他嘗試利用AI生成音樂的嘗試，比如谷歌發佈的AudioML和OpenAI的Jukebox，視覺和聲音AI項目Riffusion則使用穩定擴散將文本提示轉換為聲圖。還有一些AI工具可將生成式AI和音樂結合在一起，比如Voicesmod的合成歌曲生成器，它可將提交的歌詞與一系列流行歌曲和AI聲音進行匹配。

不過，谷歌研究人員在論文中也提到了AI音樂生成面臨的各種挑戰。相比從文本到圖像的機器學習，缺乏配對的音頻和文本數據是一大障礙。此外，音樂是“沿著時間維度”構建的，讓AI了解文本表達的意圖，創作出一段符合主題的持續的音樂要困難得多。

MusicLM是克服挑戰的重要一步。據極客邦科技網站報道，MusicLM將有條件的音樂生成過程建模，變為分層序列到序列建模，也就是説，它使用機器學習為歌曲的不同層次生成序列，如結構、旋律和單獨的聲音，並在幾分鐘內以恒定的24千赫茲創建音樂。

AI會取代人類創作音樂嗎

目前，自動化創作音樂的技術已經在快速發展。AI工具可能會給藝術家提供更好的靈感。

但眾所週知，機器學習技術如同一個非常難以預測的“盲盒”。澳大利亞《對話》雜誌發文稱，使用AI生成音樂只是目前的一次“幸運的探險”。使用這些工具時，人們有時可能會發現黃金，但不知其中的原理是什麼。藝術家們現在不得不接受“潘多拉魔盒”已經被打開的現實，就像當初合成器和電子鼓第一次出現時一樣，在某些情況下，它可能會部分取代對音樂家的需求。

但目前，MusicLM還無法與人類作曲家匹敵，尤其是在歌詞創作方面。美國專注于語音智慧的線上媒體Voicebot.ai評論稱，MusicLM生成的歌詞充其量只是亂碼，甚至是在胡謅。谷歌研究人員也承認，MusicLM大約1%的創作內容只是在單一地複製現有的音樂。

因擔心版權風險以及道德問題，谷歌表示目前沒有立即發佈MusicLM的計劃。有法律版權專家表示，AI系統音樂可被視為衍生作品，在這種情況下，只有原創元素才會受到版權保護。不過，如果藝術家的作品在其不知情或未經他們同意的情況下被用來訓練AI系統，那麼AI音樂生成器還可能面臨涉及侵權的訴訟。如果沒有監管，這很可能成為音樂行業的另一個灰色地帶。

[列印] [收藏] [發表評論]

分享到: