用大數據預測音樂黑馬
- 發佈時間:2016-02-18 02:32:37 來源:北京晨報 責任編輯:羅伯特
音樂行業一直在被人的直覺推動。一首歌會不會火,一個歌手會不會紅,一場演唱會會不會大賣,這些往往都是靠音樂公司高管們的直覺判斷。於是,才有了各種意外的“走紅”或者“滑鐵盧”。
北京晨報訊 大數據時代,音樂界迎來一場革命:下一首歌流行什麼,聽眾説了算。
阿裏音樂正在開展一項嘗試:將阿裏音樂平臺上的用戶行為數據與社交網路數據、新聞資訊數據等結合,借助阿裏雲“數加”上的大數據工具,預測哪些音樂人會成為下一個音樂巨星。
有猜測指出,這項技術同阿裏音樂一直秘而不宣的新平臺有密切聯繫。
先鋒藝術家安迪·沃霍爾曾説過:“在未來世界,每個人都有可能出名5分鐘。”對於唱片公司來説,如何預知誰會是下一個5分鐘的黑馬,成為難題。
阿裏音樂的數據工程師介紹,用戶在音樂平臺上收聽、分享、收藏音樂的行為,以及在社交網路、視頻網站、貼吧論壇上做出關注、評論、轉發、點讚等動作,反映了對音樂人的喜好程度。我們用word2vector演算法對關鍵詞進行聚類,結合轉發點讚等原始及衍生特徵,通過gbdt分佈式演算法進行預測分析。“尋找隱藏在其中的下一個TFboys”。
數字唱片公司DigSin首席執行官傑·弗蘭克曾表示,大數據技術不是要把人的因素抹去,而是最大程度地呈現人的因素——受眾的反應。“這恐怕是音樂史上最平民化的時刻。”他説。
收集所有人的意見並做出判斷,並非易事。阿裏音樂的工程師介紹,該項目僅每天要處理的阿裏音樂平臺數據就達到了100TB,更不用説海量的外部網際網路數據。大數據技術的飛躍為這一設想的實現提供了基礎。
在過去的5年裏,全球大數據計算性能實現了超過21倍的提升。2011年,Tritonsort排序100TB數據需要8274秒;到2015年,阿裏雲的MaxCompute只需要377秒。
開發團隊用不到2個月時間就完成了整個項目。“就像搭積木一樣,阿裏雲上有我們需要的所有大數據工具”。
除了MaxCompute,阿裏雲的分析性數據庫Analytic DB可以對90億條的粉絲關係數據進行實時查詢計算;機器學習工具整合了大量演算法,簡單拖拽便可實現特徵工程及訓練模型的搭建。
預測黑馬還只是音樂行業大數據革命的一角。BBC基於音樂雷達軟體Shazam提供的數據,在全球4900個城市中找到了擁有相同音樂品位的“孿生”城市。Shazam能夠採集外部歌曲的指紋,並同伺服器端指紋比對,從而實現歌曲識別。
美國的House of Blues採用一種獨特的演算法去安排“拼盤明星巡演”。對於音樂人而言,可以結合粉絲地理位置數據,安排更合理的演唱會巡演路線,以便最廣泛地接觸忠實歌迷。同時,還能根據當地情況,編排不同的曲目。
眼下,大數據正在嘗試回答音樂圈內一個古老的問題:下一首歌,你想聽什麼?
- 股票名稱 最新價 漲跌幅