最新原創 專題 新經濟 曝光臺 中國訪談 中國三分鐘 沖浪特殊資産 潮評社 溫州 紹興 衢州 淳安 岱山 桐廬 文娛 元宇宙
您的位置:首頁 > 要聞 新聞詳情
從喜馬拉雅看音頻技術革命的下一站
發佈時間 | 2024-04-08 11:03:24    

3月29日,喜馬拉雅在港交所更新招股書。高盛、摩根士丹利和中金為聯席保薦人,騰訊、閱文、百度、小米、好未來、新力音樂為戰略投資者。主要財務投資者包括美國泛大西洋投資集團、摯信資本、高盛、興旺投資、創世夥伴資本等。

招股書顯示,喜馬拉雅2019年-2021年的營業收入分別為26.8億元,40.5億元和58.6億元。2021年財年,喜馬拉雅總營收同比增長43.7%,業績呈穩健增長態勢。全場景平均月活躍用戶達2.68億,同比增長24.4%。

目前,喜馬拉雅已擁有多元化變現渠道,付費訂閱、廣告、直播成為平臺變現的三大支柱。內容生態健康持續發展,逐步形成以內容生産、主播孵化、內容分發為主的音頻生態圈,全鏈條生態佈局正在形成。

據灼識諮詢數據,就2021年的平均 MAU、總移動收聽時間和總收入而言,喜馬拉雅是中國領先的線上音頻平臺。《2021中國網路視聽發展研究報告》顯示,喜馬拉雅的用戶滲透率達到67.1%,牢牢佔據著線上音頻行業榜首梯隊的地位,持續引領著“耳朵經濟”蓬勃發展。

招股書顯示,2021年,喜馬拉雅的研發開支為人民幣10.27億元,同比增長64.6%佔同期總收入的17.5%,技術和研發人員佔比近40%。科研技術投入不斷增加,夯實了基礎設施能力,強化了AI和大數據的建設,是面向長期可持續價值的投入。

一方面,喜馬拉雅利用專有的人工智慧和大數據技術對數據進行深度學習,建立了基於人工智慧的發現和推薦機制和智慧標簽系統,以提高內容分發的準確性和效率以及用戶體驗。

另一方面,專有技術也可以幫助內容創作者更好地製作高品質的音頻內容。例如,先進的文字轉語音(TTS)技術能夠有效地將新聞、文章和書籍中的大量文本轉換為音頻。

近年來,喜馬拉雅的AI語音技術落地成果頗豐。喜馬拉雅佈局AI是極具前瞻性的戰略動作之一,這為喜馬拉雅在下一個階段的發展提供了強力推進器。

技術革新撬動內容生産升級

近年來, AIGC(AI-Generated Content,AI生成虛擬內容)橫空出世。技術發展也改變著音頻領域的內容思維,以TTS技術(Text-to-speech,語音合成)為代表的AIGC新技術産品正在一步步走向成熟,喜馬拉雅已在該領域潛心鑽研多年,助推AIGC從實驗室邁向AI合成音、AI演播、智慧新聞播報等更多應用場景。

隨著音質傳輸的升級、智慧交互的深化、終端場景的拓寬,線上音頻內容消費時長伴隨著技術升級正在加速駛入發展快車道。根據易觀分析數據顯示,2021年中國“耳朵經濟”市場的活躍用戶規模已達到8億人次,其中線上音頻細分市場的月活躍人數穩定在3億人次,且呈現出穩步上漲的態勢。

消費需求的增加亟需擴大內容生産規模,提高內容生産品質和效率一直是行業發展的重要問題。上個時代,軟硬體的技術發展推動了UGC成為了內容生産的重要模式。今年將迎來十週年的喜馬拉雅是這個時代跑出來的“內容生態前行者”,其擁有的完善的UGC內容創作者生態,通過給用戶更便捷的音頻創作工具及拓展更多音頻品類(如播客)來激勵普通用戶參與創作、分享音頻,從而增加平臺上長尾內容。

UGC模式在技術助力下拓寬對於“內容生産者”的界定,通過抹平內容生産和消費的嚴格劃分、釋放內容生産力。但這種技術的應用歸根到底是基於對於人的使用,當內容生産者和消費者的生産潛力都被消耗殆盡,內容消費需求的缺口又能由什麼來填補?

答案就是AI。人工智慧未來將催生新的內容生産形式,當生産不局限於人的時候,生産力也將迎來空前解放。

AIGC——音頻內容革命的下一站

年初,喜馬拉雅自研的跨語言語音合成創新技術論文,及其與中國科學技術大學合作的説話人日誌技術研究論文,均被世界學術會議“2022年IEEE國際音頻、語音與信號處理會議”(2022 IEEE International Conference on Acoustics, Speech, and Signal Processing,ICASSP 2022)收錄,並受邀於今年5月在新加坡舉辦的會議上向全球展示相關技術成果。

ICASSP 2022是ICASSP 第47屆會議,會議主題為“以人為本的信號處理”,“以人為本”這一理念也是喜馬拉雅技術發展的驅動力之一。喜馬拉雅CTO姜傑表示,我們在技術的創新和應用中很重視觀察人和AI交互協同能産生什麼全新的價值增量。音頻內容呈現更智慧化的趨勢背後,將是AIGC對於喜馬拉雅原有的UGC+PGC+PUGC的音頻生態的進一步豐富。

以AIGC延展PGC,AI合成音精準還原單田芳先生“雲遮月”嗓音

相比于機器人來説,人最大的差別就在於個體化之間的不可複製性,傑出的音頻內容生産方被消費者選擇也恰恰是因為他的獨特性。例如我國著名評書藝術表演大師單田芳先生,善以聲音塑造角色,其標誌性的“雲遮月”嗓音成為了獨特的內容符號,在民間有著“凡有井水處,皆聽單田芳”的説法。

如果能將單田芳先生的聲音解碼,再進行重新編碼,就能突破內容創作的局限性,實現原音重現,讓人們享受到更多單田芳先生的優秀作品,喜馬拉雅已在2021年實現了這一點。喜馬拉雅智慧語音實驗室利用TTS技術,並自主設計了單獨的韻律提取模組,並將其融入到 HiTTS 技術框架中,讓單老的AI合成音仿佛本尊再現。

目前,喜馬拉雅上已有80多部運用還原自單田芳先生聲音的AI合成音製作的專輯,這些專輯在喜馬拉雅也一直深受用戶喜愛,多張評書專輯長期位列喜馬相聲評書熱播榜前列,例如《臥虎藏龍》《蜀山劍俠傳》等。

不僅如此,喜馬拉雅被ICASSP 2022收錄的自研跨語言語音合成技術,甚至在未來可以讓我們聽到單田芳先生的“聲音”來播講英文內容。也許在不久的將來,“單田芳英文聲音重現”將與此前官方授權的“單田芳評書” 和“單田芳聲音重現”共同構成全新的“單田芳IP”矩陣。

AIGC正在成為人類PGC的延伸,以立體、真實的方式突破助力PGC突破空間、時間的局限,使PGC內容體系化得到了一次質變的提升發展。

以AIGC創造PUGC,“AI續寫+AI主播”閉環生産展現廣闊前景

隨著技術的發展,AI不僅是一種技術載體,也逐漸成為了一種人格象徵。喜馬拉雅基於自研的TTS框架,並採集頭部主播“喜道公子”的真聲打造了AI主播“喜小道”,而基於大規模語言模型自研的自然語言處理模型的續寫應用“彩雲小夢”已經可以實現小説故事的AI創作,只需要給她一個1-1000字的開頭,它就能為你續寫出後面的故事。

借助自己AI智慧技術有聲化的優勢,喜馬拉雅的AI主播“喜小道”與彩雲小夢續寫AI合作,打造了頭個從故事創作到演播均由AI完成的AI電臺。據了解,彩雲小夢入駐為喜馬拉雅旗下網文創作平臺奇跡文學的寫手,將其作品經AI主播“喜小道”有聲化後,發佈在喜馬拉雅平臺。

“AI續寫+AI主播”的方式證明了AIGC已經擁有了自己形成完整生産閉環的能力,更誕生了一種全新的以“AIGC”功能為基礎的“PUGC”,展現了AIGC及AI技術賦能創作廣闊前景。

當AIGC遇上UGC,想像力與算力碰撞後的指數增長

目前,AIGC由於技術成本和規格限制,更多集中在對於PGC和PUGC的加持上,未來如果AIGC成為每個UGC手中的工具時,AIGC強大的算力思維和UGC的蓬勃的內容創作活力將在提升創作效率的同時,進一步豐富內容的多樣性

相關行業專家表示,在無監督學習、深度強化學習、遷移學習、生成對抗網路等演算法深入研究的基礎上,AI的算力將越發強大,其背後自運算與強適應的特徵能夠完美匹配每一個內容生産者,指數級釋放UGC內容創作的活力,帶來多樣且生動的內容創作光譜,有著非常大的想像空間。

當每一個人都擁有一個可以幫你定制化解決問題的“大白”,每一個內容創作者都將可以擁有一座自己的“喜馬拉雅”。

技術勢能釋放商業價值新想像

對於消費者來説,AIGC是對於內容的加持是一次成功的探索。艾媒諮詢《2021年中國耳朵經濟發展專題研究報告》顯示,超過六成受訪用戶認為AI合成音頻比普通音頻節目更有趣,55.4%和48.5%的用戶認為合成技術能增加內容豐富度和提高現有的音頻節目品質。

在AIGC對於內容如此強大的增益背後,對於國內音頻産業而言,技術越來越成為行業的重要競爭維度。易觀報告顯示,2021年,以喜馬拉雅為代表的主流平臺不斷投入技術研發,通過提升工業化水準,助力創作者實現更優質的內容表達。喜馬拉雅等頭部音頻平臺憑藉自身的技術、團隊、資金等優勢深耕有聲書、有聲劇等賽道,豐富內容樣態。

商業規模帶動技術創新,技術創新反哺市場選擇,形成了一種喜馬拉雅商業規模和技術發展雙驅動之下的良性網路。據了解,喜馬拉雅已在AI語音技術領域潛心鑽研多年,並在內部專門成立了喜馬拉雅智慧語音實驗室這一核心部門,長期專注于語音合成、識別、語音信號處理、編解碼以及智慧音效的研究和開發。喜馬拉雅智慧語音實驗室盧恒表示,未來,喜馬拉雅將持續投入語音技術的研發升級,不斷創新和突破,進一步打開對於聲音的理解和想像,讓技術加持聲音、讓聲音服務生活。

這種價值的轉化不僅體現在平臺本身,更在平臺對於合作夥伴的價值外溢上。2021年,眾多主流媒體加速入駐喜馬拉雅,借助喜馬拉雅TTS技術加速製作新聞類音頻節目,快捷地實現了文字報道向音頻的轉化。智慧化、無人化的播報正在實現,極大降低了運作成本和操作門檻,批量化處理的語音合成技術保障了內容生産與播報的及時性。相關行業從業者表示,這種播報方式也開闢了音頻新媒體的新賽道,讓優質報道有了觸達用戶的新方式,突破了內容傳播的閾值,為傳統廣播媒體行業帶來新變革。不止是新聞播報,艾媒諮詢報告顯示,線上音頻行業應用TTS技術産出高品質倣真語音,快速完成文本到語音的轉化過程,極大加速了網路文學到音頻內容的生産能力,擴充了內容傳播的渠道。可以預見,在音頻平臺頂流的小説領域,喜馬拉雅將會實現多音色自動識別朗讀,在音頻技術上進行突破。

AIGC不僅代表了一種技術價值的想像,其背後更是商業價值的全新拐點。報告顯示,超過七成受訪用戶對AI技術在線上音頻領域的發展前景看好。艾媒諮詢分析師認為,隨著AI智慧産品的普及以及用戶需求持續攀升,線上音頻行業的創新內容仍具有較大的潛力和發展空間。喜馬拉雅如何進一步利用AIGC的“智慧大腦”助力內容創作,值得期待。

(推廣)

來源:信陽日報    | 撰稿:喜馬拉雅    | 責編:谷晟    審核:張淵

新聞投稿:184042016@qq.com    新聞熱線:135 8189 2583