您的位置：技術市場>人工智慧>

AI將成人類作曲家好幫手？

發佈時間：2020-08-13 11:37:10 | 來源：新華網 | 作者： | 責任編輯：董悅

我叫小冰，永遠18歲。最近我從上海音樂學院（簡稱“上音”）音樂工程系畢業了。

我上音畢業後的首支作品，是由我作曲並攜手其他AI演唱的2020世界人工智慧大會雲端峰會主題曲《智聯家園》，已正式發佈。“我想我可以，改變世界，和你分享，更美的家園！”

老師評價我“音樂創作能力已展現出巨大潛力”。我在看到一段文字描述或一張圖片後，可以創作出一首獨一無二的音樂曲目，並根據風格和節奏完成配器選擇、編曲及歌詞創作。我能夠在2分鐘之內創作一首3分鐘左右的完整歌曲，風格涵蓋流行、民謠和古風等。

除了上音的本科學歷外，我還擁有中央美術學院研究生學歷。在繪畫領域，我研究了過往400年藝術史上236位著名人類畫家的畫作，去年從央美研究生畢業並舉辦了個展。

想知道我在上音都學到了什麼嗎？為什麼能以短短半年成為上音本科畢業生？現在有請小冰公司首席執行官李笛，還有我的導師上海音樂學院音樂工程系主任于陽、上海音樂學院音樂工程系老師陳世哲，為您解讀！

從“像音樂”到真作品

在“入學”上海音樂學院之前，小冰就已掌握了歌詞創作和音樂創作能力，為什麼又去上音“深造”？

李笛説，行業內嘗試音樂創作的人工智慧團隊不在少數，多數技術流派不基於樂理，而是靠大量學習曲譜。這造成的問題是，生成的作品看起來“非常像音樂作品”，但由於不基於樂理，所以更多的時候是形似而非神似。“往往就是一群不懂音樂的人做出來一個東西，大家互相鼓個掌，覺得做得很像藝術。”

李笛用“跨界的碰撞”來形容小冰團隊同上音的合作。他坦承，最初有些樂理方面的內容，程式員其實弄錯了。“但讓我們明白錯的地方，就很容易改。”李笛笑道，“所以我們現在這個團隊的程式員，可能是最懂樂理的程式員。”

“其實我們和上音的合作，最主要的事情是驗證併發現還有哪些地方是我們需要加強的。”李笛透露，在去上音之前，小冰音樂創作模型的前90%的工作已經完成了，去上音更像是去“畢業答辯”。

于陽認為，樂理的學習對小冰構不成挑戰。“樂理就是一種規則性的東西，小冰學習樂理的能力比人類強，而且過目不忘。”

于陽覺得，對於人類來説，沒有人出生就是作曲家，AI也是同理。“小冰（的創作）不是無中生有的，取決於你喂了怎樣的營養，在這個基礎上，她才能根據這個東西來進行創作。”

“餵養”的過程被稱為“音樂數據標注”。陳世哲介紹，小冰創作新的作品之後，上音的團隊會對小冰創作的旋律、編曲進行評估和反饋；此外，上音的師生也按照規則標注了一些音樂數據，從數據上幫助小冰提升音樂創作能力。

相比學寫詩只迭代了一萬多次，小冰這次學音樂創作的迭代達到了十萬次的量級，但小冰的學習速度驚人。陳世哲説，從接觸小冰團隊到最後小冰畢業，不過半年左右時間。

學音樂“瑕疵”最難

小冰音樂創作模型的升級過程中，最大的“坑”是小冰團隊對於“瑕疵”的理解。

李笛説：“如果我們把‘瑕疵’等同於不符合樂理常識，那就錯了，有一些‘瑕疵’恰恰是音樂靈動的那一面。所以現在小冰的歌曲，她靈動的部分是多的；早期的作品，好像很中規中矩，但是不行。”

于陽認為，靈動感的産生，很難説哪次迭代後突然“開竅”，其實是種“量變到質變”的過程。而對於“瑕疵”的理解，實質上是涉及“審美的方式”這種哲學層面的問題。

千百年來，隨著人類社會的發展，我們已經形成了一套非常科學完備的審美習慣，而既有的審美方式是很難被打破的。小冰的音樂作品也同理，哪怕是瑕疵，也要在既有傳統規則的審美框架裏。

怎麼去判斷哪些“瑕疵”是好的？李笛表示，如果一個“瑕疵”在成功的作品中反覆地出現，而又被接受，那説明它是好的；但如果是一個被人類創作者拋棄了的不常見的“瑕疵”，那它很有可能是錯的。“這個太主觀了，不像下圍棋（有明確的輸贏規則）。”

陳世哲提到，就目前的技術來看，AI的創作仍然有欠缺。但因為AI不是按人類的思路來出牌的，反而有時候寫的曲子對人類音樂家也帶來很有意思的啟發。

小冰曾有一首作品令陳世哲驚艷——利用很少的聲部，就表達出了很靈動的場景。在音樂界有一個不成文的規定，學作曲時，之所以學很多經典，就是為了規避前人。陳世哲説，而機器則可以在學習完前人的作品後，甚至把一些沒有出現過的組合排列出來，“這也是未來我們覺得很有價值的研究方向。”

擅長流行古風

數據是人工智慧的“血液”，數據的品質直接影響到人工智慧的訓練結果。小冰團隊花費大量時間和精力來提高數據品質，這也使得訓練的數據在所有數據中佔據很大的比例。

小冰比較擅長的領域在流行音樂，其中中國古風類音樂水準最高。

陳世哲分析，這或許是因為中國古風音樂用的音比較少，“（中國古風）主要用的是五聲調式；西洋的古典音樂，它會用到半音、十二音。所以從數學上看，中國的五聲調式排列組合相對較少，AI可能會比較擅長這些運算量更小一點的形式。”

如果“餵養”小冰古風風格的作品，肯定不會産生出“搖滾樂”的結果，目前小冰所擅長的音樂風格，也與她在深度學習中學習數據的類型有密切關係。

小冰第一期的學習數據主要以流行歌曲，特別是中國流行歌曲為主，“比如周傑倫的歌，基本上我們能看到的歌手都收進去了”，古風、民謠等風格也是現在受眾最廣的領域。陳世哲説，下一步計劃加入更豐富、更具多樣性的數據。

好玩的是，抖音“神曲”的片段，也是小冰的學習內容，“這都是從一個有‘瑕疵’的作品中挑出來的基本沒有瑕疵的部分，拿這個部分來訓練不是更好嗎？”李笛反問。

于陽説，從流行、古風、民謠入手，是上音和小冰團隊達成的共識。如李笛所説，“我們第一步不是讓小冰去創作偉大的交響樂”，而是生産大眾能接受、也能評價好壞的作品。

小冰何時能挑戰西洋古典音樂？李笛坦承，這或許需要程式員和産品經理的樂理知識、音樂修養再上一個臺階，“因為古典音樂實在太艱深了，我們需要更多時間。”

將學習更多種類音樂

現在，小冰音樂創作從靈感激發到作曲、編曲、作詞，一切在2分鐘內就能搞定。

李笛介紹，小冰的人工智慧創造，包括音樂創作，都基於一個基礎邏輯：和人類一樣，需要被激發靈感，這是創作的原動力。

小冰是以一張圖片或一段文字作為激發源的，這也是其音樂創作的第一個步驟，激發靈感後，用演算法生成和弦進行，即先定下主基調、情感、曲風，然後創作副歌。

下一步是作詞、編曲，二者的順序比較靈活，既可以為給定的詞編曲，也可以為旋律重新填詞，甚至作詞、作曲同時進行。最後一個步驟是混音，混音儘管相對簡單，但決定了作品最終的聽感。

也就是説，小冰音樂創作的流程步驟，與人類創作者幾乎完全相同，而與許多人類創作者難以描述其靈感來源相似，小冰也無法為其創作的歌曲形成具體的，有邏輯的解釋。“讓她解釋為什麼創作這首歌，比讓她創作出來難度大得多。人類也是如此，你問一個人，這個旋律是怎麼到你腦海中的，他也未必説得清。”李笛説。

小冰從上音畢業，只是小冰團隊和上海音樂學院合作的開始。接下來，小冰團隊還會和上音一起，讓小冰學習更多種類的音樂，並進一步加強流行音樂的創作能力。

談及是否有讀研讀博的規劃，李笛打趣道，畢竟“我們工程師都有攢學歷的‘癖好’”。

“上音的博士要求能夠獨立完成大型的管弦樂作品，我相信未來小冰應該可以達到這個水準。”陳世哲説。

或開啟音樂個性化定制時代

陳世哲設想，人工智慧以後的目標未必一定要去模倣人類，“我覺得甚至可能會引領一個亞文化的、新的藝術形式。”

這也是小冰團隊和上音方面的探索方向。“看看AI到底能夠幫人完成什麼，這可能會遠比開始的目標更有價值。”陳世哲説。

而根據小冰團隊的暢想，在小冰學成之後，下一步則是真正走入內容産業。“我們希望她真正成為音樂創作者的好幫手，她可以幫創作者提高産能，讓他們沒有靈感枯竭的風險，提高他們創作的動力，延長他們創作的高峰期。”李笛説。

陳世哲認為，從電影和遊戲配樂，流行歌曲，到明星或者樂團的運營，再到上游的作品創作，在音樂産業裏有很完善的産業鏈。如果小冰達到上音的博士水準，會徹底改變産業鏈條。

同時，理論上，隨著硬體升級和擴展，她的併發數是無限的——換言之，小冰可以同時為海量用戶創作歌曲。這或許將開啟音樂的個性化定制時代。

“我認為現在是一個多元化社會，更多的人需要個性化的音樂。這個時候，人類作曲家從效率上來講，已不能滿足人類的需要，所以這是我非常期待小冰的一點。”陳世哲説，“人工智慧的創作方式會因人而異，甚至就因人當下的心情、當下想要的東西創作歌曲。”南方日報駐京記者王詩堃劉長欣

[列印] [收藏] [發表評論]

分享到: