您的位置: 技術市場>人工智慧>

AI虛擬主播“上新” 性格與角色可按需定制

發佈時間:2022-05-19 15:36:30  |  來源:科技日報  |  作者:吳長鋒  |  責任編輯:徐麗麗

“大家好,歡迎來到科大訊飛官方直播間,我是你們的主播茜茜。”


“我是茜茜的妹妹西西,別忘記點個‘關注’哦,今天晚上福利可是很多的。”


5月15日,真人主播茜茜牽手“孿生妹妹”亮相科大訊飛抖音直播間。這對“雙胞胎主播”雖然是樣貌相同的“姐妹花”,但西西借助科大訊飛新推出的“AI虛擬人直播系統”,不僅復刻了真人主播茜茜的外在,還賦予了其驅動的能力,從而能夠實現虛擬主播實時直播。


AI虛擬主播性格可定制、角色能多選


當下,越來越多的AI虛擬主播走進了大眾視野,在直播間、短視頻平臺等頻頻“出道”,憑藉多維度、全感官、沉浸式的交互體驗,成為時下的“主播熱選”,集“萬千寵愛于一身”。


“科大訊飛AI虛擬主播依託語音識別、人臉建模、口唇預測、音頻驅動等自主關鍵技術,支援用戶通過文本或者語音輸入驅動虛擬人進行直播,從而實現智慧驅動,快速便捷地進行虛擬直播。”科大訊飛研究院執行院長劉聰告訴科技日報記者。


劉聰表示,科大訊飛基於大數據多模態預訓練的語種及説話人無關的口唇驅動框架,在保證高真實度的口唇合成效果的同時,還可以實現不同類型語音,包括不同語種、方言、音色的口唇驅動,讓虛擬主播無懼時空限制,哪怕是在臥室的床邊也能進行直播,而且隨時可以與真人主播“無縫切換”,方式更加靈活、多變。“而‘AI虛擬人直播系統’還擁有豐富的場景庫,可以根據直播內容、虛擬人‘性格’等自由定制,打造專屬的虛擬人直播間。”劉聰説。


據介紹,科大訊飛“AI虛擬人直播系統”擁有豐富的形象庫,不僅能根據受眾喜好、需求個性化選擇五官“捏臉”,創造一個全新的虛擬人,還可以根據不同場景賦予其相應的形象氣質,或2D或3D、或半身或全身、或“鹽”或“甜”……“科大訊飛先進的語音合成技術,還能為虛擬人定制個性化語音庫,還原真人主播的聲音或是定制特色聲音。多語種技術更是讓AI虛擬主播既支援中英混合播報,又支援日、韓、泰、越等多國語言,國際范兒十足。”劉聰説。


可用於多個行業,未來也能“走進”尋常人家


記者在採訪中了解到,AI虛擬主播還可針對不同需求提供多端介面,並能面向多個場景提供垂直且完善的解決方案,可用於媒體、金融、文旅、政企等多行業,提供音視頻內容自動化生産、智慧交互的AI産品服務,輔助實現自動化、智慧化的客戶價值。


其中,在媒體新聞場景中,可針對海量的音視頻內容實現新聞內容的音視頻生産自動化。只要輸入文字即可“一站式”生産成品視頻,尤其是對重大、突發新聞等更新頻率較高的內容播報,能顯著提升效率。目前,央視新聞、人民日報數字傳播、合肥電視臺等媒體,與科大訊飛共同打造的AI虛擬主播均已“上崗”,表現出色。


“以‘虛擬人為載體的新一代人機交互’將快速進化,我們需要在感知、理解、表達等多個維度持續取得技術突破,讓人機交互體驗得到跨越式的提升。簡單來説,就是我們希望虛擬人越來越聰明,Ta們懂情感、有個性,能夠幫助人類協助我們的工作和生活。”劉聰對虛擬人未來發展充滿信心。


劉聰認為,從生産生活到奧運賽場,人工智慧早已不是沒有言語、冷冰冰的技術,而是飽含溫情、賦能萬物的科技力量。基於AI虛擬人交互平臺底座研發的“AI虛擬人直播系統”,未來將會逐漸開放上百個虛擬形象、上千個音庫,提供多模感知、多維表達、情感貫穿、自主定制的特色服務,讓虛擬主播的形象更真實、情感更靈動、交互更智慧。


AI如同水和電一樣已融入百姓生活。劉聰表示,未來通過將技術與産品和應用場景深度融合,虛擬人也能“走進”尋常人家,給人們的工作和生活帶來更便捷的服務,成為人類的親密夥伴。


 
分享到:
0