匯集眾多AI硬科技!
9月19日,2024雲棲大會在杭州雲棲小鎮開幕,此次大會以“雲啟智躍,産業蝶變”為主題,吸了眾多前沿技術企業展示AI時代雲上創新的潮流科技。喜馬拉雅珠峰AI音頻多模態大模型亮相雲棲大會,在“人工智慧+”主題館吸引眾多市民駐足圍觀體驗。
AI(人工智慧)已經在深刻影響著我們的生活,也影響和改變著內容創作行業。作為線上音頻頭部企業,今年成立12年的喜馬拉雅以科技賦能文化,圍繞音頻建立了一個豐富多元的“聲音宇宙”,截至2023年12月底,喜馬拉雅已經累積了包含459個品類的4.88億條音頻,總內容時長超過36億分鐘,能滿足用戶從-1歲到100歲不同年齡階段的不同需求。
喜馬拉雅從成立之初就十分重視技術投入,特別是佈局AI,將AI技術突破作為平臺發展和演變的主要驅動力,以便能在不斷變化的數字環境中提高自身運營效率及滿足用戶需求。
在2024雲棲大會上,喜馬拉雅展示了“珠峰AI音頻多模態大模型”(簡稱“喜馬拉雅音頻大模型”)的強大功能、應用場景及商業化案例。據悉,“珠峰AI音頻多模態大模型”是喜馬拉雅自主研發的AI音頻生成大模型,依託其超百萬小時的自有版權音頻數據進行深度學習與訓練,具備情感輸出、自然表達、語種互譯、極速克隆等技術能力,並在音頻生成領域實現了多維度突破,正廣泛應用於有聲書等領域,未來將不斷推動音頻大模型行業的創新與發展。近日消息,喜馬拉雅音頻大模型已成功通過國家備案。
基於“珠峰AI音頻多模態大模型”,喜馬拉雅在雲棲大會展示了“珠峰AI創作服務平臺”:珠峰AI音視頻創作平臺,依託通義文本大模型對文本內容語義的深度理解,打造珠峰AI音頻大模型,結合喜馬拉雅獨有的全品類音色庫和數字人大模型,為創作者提供高品質的AIGC音頻和數智人服務。用戶可以在“珠峰AI數智人平臺互動體驗區”體驗AI為聲音創作帶來的變革,比如極速體驗全領域多品類535種AI音色庫生成全品類AIGC音頻內容、15秒真人數智人形象快速定制、10秒聲音極速克隆(不單音色克隆,更包含韻律、腔調、口吻等“語流”資訊)等等,感受AI高效便捷地賦能內容創作者。
AI正在深刻賦能和影響著喜馬拉雅的發展。數據顯示,2023年喜馬拉雅全場景平均月活躍用戶達3.03億。截至2023年12月,喜馬拉雅平臺AIGC內容達2.4億分鐘,佔其音頻內容的6.6%。同時,喜馬拉雅移動端平均月活躍用戶的AIGC滲透率已達14.8%。
喜馬拉雅音頻大模型具備“産模一體生態系統、持續進化的生態飛輪”的模型優勢,已廣泛應用於內容創作、數智分身、語音交互等場景,並已實現商業化。
喜馬拉雅音頻大模型在廣告領域擁有廣泛的應用場景,通過AIGC原生聲音流,實現“廣告即內容”,如喜馬拉雅聯合貴州茅臺推出“單田芳AI聲音重現”春運公益活動,聯合慕思共同打造的“邀李白共啟AI穿越之旅”活動等等。基於大模型,未來喜馬拉雅的AI能力將在智慧化廣告行銷中發揮更突出的作用。
喜馬拉雅佈局AI有其天然優勢。眾所週知,高品質的數據集是將AI塑造成可靠的解釋器的訓練燃料,從龐大的數據集中探索並獲得有意義的見解以推動AI不斷發展。據灼識諮詢資料顯示,喜馬拉雅擁有中國最全面的音頻內容生態,其中包括體量最大的音頻內容庫及數量最多的音頻內容創作者。截至2023年12月,喜馬拉雅擁有約4.9億條音頻內容,總內容時長為36億分鐘。這使得喜馬拉雅在AI時代能夠輕鬆獲取海量且多樣化的線上音頻內容以不斷演進其AI能力,這也是喜馬拉雅在AI時代的競爭優勢。
AI不僅代表了一種技術價值的想像,其背後更是商業價值的全新拐點。隨著下一代技術、AI及大數據能力的持續提升,喜馬拉雅將進一步打開聲音的想像力,持續用聲音分享人類智慧,用聲音服務美好生活。
(責任編輯:譚夢桐)