您的位置: 技術市場>人工智慧>

虛擬人發展步入快車道,騰訊數智人欲實現 “打工自由”

發佈時間:2022-05-20 10:54:57  |  來源:央廣網  |  作者:馬可佳  |  責任編輯:徐麗麗

虛擬數字人正越來越頻繁地出現在公共視野。


近日,騰訊智慧平臺産品副總裁李學朝接受央廣網記者採訪時表示,隨著雲計算、5G、人工智慧和電腦視覺等技術的不斷突破,虛擬人的製作和應用過程得到有效簡化,虛擬數字人開始加速落地。正朝著智慧化、便捷化、精細化、多樣化發展,步入成長期,並且行業發展正處於快車道。


據量子位發佈的《2021年虛擬數字人深度産業報告》顯示,預計在2030年,我國虛擬數字人整體市場規模將達到2700億。得益於虛擬IP的巨大潛力,身份型虛擬數字人約1750億,將佔據主導地位。服務型虛擬數字人則相對穩定發展,多模態AI助手仍有待進一步發展,多種對話式服務升級至虛擬數字人形態,總規模超過950億。


解讀專業賽事,手語主播的數字化逆襲


隨著AI技術不斷應用在虛擬數字人當中,使其具備了“交互智慧”的能力,騰訊對於人機交互體驗的研究也更為深入。


2022年冰雪賽事轉播中,騰訊3D手語數智人“聆語”作為央視頻AI手語翻譯官,為部分比賽提供了手語解説賽事的服務,這也是行業首次AI手語解説賽事直播。讓廣大聽障人士也可以感受冰雪賽事的精彩紛呈。



據統計,中國的14億人口裏有超過2700萬殘疾性聽力障礙人士,專業手語翻譯卻少之又少。在這一領域投入技術研發,除了新聞行業的硬性需求,也體現了對社會少數群體的關愛之情。


用手語解説新聞及現場賽事,並不是人們想像中那樣簡單。原因是手語表達的順序與自然語言輸出的順序並不一致。在語句文字輸出量大、語音播報速度比手語播報快30%-50%的情況下,手語翻譯的速度很難跟上人的語速。


此外,想讓AI手語主播更像“人”,除了手語流暢,其他配合也十分重要。比如表情神態、動作的流暢度,以及理解輸出的“業務能力”等等方面。這一點不僅適用於AI手語主播,其他數字人産品也是如此。


為了解決手語主播的“業務能力”問題,由中國聾人協會、國家手語和盲文研究中心和中國殘疾人聯合會共同編輯出版的《國家通用手語詞彙》共收錄了8000多個常用詞彙,可聆語的詞彙量能達到23000個,掌握的詞彙和語句可以達到160萬。針對2022年冬奧賽事,還涉及很多專業詞彙,為了讓手語主播“聆語”更好地服務賽事解説,騰訊數智人團隊跟專業的老師不斷摸索,去約定和定義專業詞彙,使其能達到聽障人士的可懂度,李學朝告訴記者,“這樣的專業詞彙,我們摸索了15000多個。”


騰訊3D手語數智人“聆語”, 最終用“新一代多模態人機交互系統”解決了這一問題,包括後臺騰訊雲小微的解決方案引入語義驅動技術,即根據數智人説話的語義,去匹配對應的動作和字詞。它結合對話AI可以更好滿足客戶的服務場景,對溝通的內容有更細緻的把握,也能在場景中通過肢體語言和表情、聲音更好地傳遞豐富的情感表達,帶來全新的人機交互體驗。



騰訊3D手語數智人“聆語”,在2022年首次完成了數智人在大型賽事中落地應用。前幾日,新智元公佈的一份榜單中,“聆語”憑藉出色表現,成功入圍數字虛擬人Top榜單,也展示了騰訊“雲小微”強大的交互智慧技術能力及産品優勢。


産業落地,數字人如何實現進一步“打工自由”


在騰訊看來,已通過實際的應用驗證了虛擬人這一行業的可行性。但虛擬人産業無論是技術、産品還是産業應用,都還處在起步階段,還需要在各方面進行深入的探索與突破。


目前,騰訊數智人已經在金融、傳媒、政務、文旅、公共服務等場景落地應用,承擔坐席客服、審核面簽、理財顧問、資訊播報、會展主持、導遊導覽等多種角色。


比如在金融領域,騰訊數智人可以成為“金融證券虛擬客服”,支援基於標準化開戶流程智慧引導客戶開戶,為客戶提供高效有溫度的遠端一站式服務。


同時,各個平臺都在進一步降低數字人的應用門檻,力爭讓更多人能夠實現“數字人自由”。


快速發展的行業,往往伴隨著風險。近年來AI被廣泛應用到醫療、金融、工業生産等多個重要領域之中,在幫助各行業提升生産力的同時,也帶來了諸如隱私洩露、決策歧視、模型決策誤判等風險。


日前,在騰訊AI lab、騰訊研究院承辦“人工智慧安全與隱私”論壇上,相關方分享了在可信AI方面的思考。比如找到合適的方法來定量分析、量化人工智慧演算法、模型、系統的穩定性、可解釋性、隱私保護能力及公平性。


李學朝表示,如果人工智慧在上述“可信”度量上都達到很高的共識水準,就有更好的機會做到明確責任、透明可信,並且推動人工智慧在産業上的進一步落地。


此外,數智人由於是多種AI的綜合應用,需要解決挺複雜的技術挑戰以突破行業發展的瓶頸:第一,虛擬人不僅要聽得到、聽得清人類的語言,還需要能聽得懂、説得出,隨著人機交互的體驗和場景的不斷深入,複雜應用場景給技術提出了更高的要求;第二,數字員工類應用需要技術深入結合行業,這類懂行業的複合型人才也是緊缺的。


李學朝進一步認為,未來隨著AI驅動技術的進步,基於新一代多模態人際交互技術的業務型、功能型虛擬人,可以通過整合語音交互、知識圖譜、視覺識別和情緒識別等技術,有效連接資訊和服務、B端和C端,在垂直産業鏈條中提供智慧化服務,以適應更多的行業化、業務化、場景化需求,這將大大拓展數字虛擬人未來的市場空間,並助推這一新興領域的價值躍遷。

 
分享到:
0