虛擬人發展步入快車道，騰訊數智人欲實現 “打工自由”

發佈時間：2022-05-20 10:54:57 | 來源：央廣網 | 作者：馬可佳 | 責任編輯：徐麗麗

虛擬數字人正越來越頻繁地出現在公共視野。

近日，騰訊智慧平臺産品副總裁李學朝接受央廣網記者採訪時表示，隨著雲計算、5G、人工智慧和電腦視覺等技術的不斷突破，虛擬人的製作和應用過程得到有效簡化，虛擬數字人開始加速落地。正朝著智慧化、便捷化、精細化、多樣化發展，步入成長期，並且行業發展正處於快車道。

據量子位發佈的《2021年虛擬數字人深度産業報告》顯示，預計在2030年，我國虛擬數字人整體市場規模將達到2700億。得益於虛擬IP的巨大潛力，身份型虛擬數字人約1750億，將佔據主導地位。服務型虛擬數字人則相對穩定發展，多模態AI助手仍有待進一步發展，多種對話式服務升級至虛擬數字人形態，總規模超過950億。

解讀專業賽事，手語主播的數字化逆襲

隨著AI技術不斷應用在虛擬數字人當中，使其具備了“交互智慧”的能力，騰訊對於人機交互體驗的研究也更為深入。

2022年冰雪賽事轉播中，騰訊3D手語數智人“聆語”作為央視頻AI手語翻譯官，為部分比賽提供了手語解説賽事的服務，這也是行業首次AI手語解説賽事直播。讓廣大聽障人士也可以感受冰雪賽事的精彩紛呈。

據統計，中國的14億人口裏有超過2700萬殘疾性聽力障礙人士，專業手語翻譯卻少之又少。在這一領域投入技術研發，除了新聞行業的硬性需求，也體現了對社會少數群體的關愛之情。

用手語解説新聞及現場賽事，並不是人們想像中那樣簡單。原因是手語表達的順序與自然語言輸出的順序並不一致。在語句文字輸出量大、語音播報速度比手語播報快30%-50%的情況下，手語翻譯的速度很難跟上人的語速。

此外，想讓AI手語主播更像“人”，除了手語流暢，其他配合也十分重要。比如表情神態、動作的流暢度，以及理解輸出的“業務能力”等等方面。這一點不僅適用於AI手語主播，其他數字人産品也是如此。

為了解決手語主播的“業務能力”問題，由中國聾人協會、國家手語和盲文研究中心和中國殘疾人聯合會共同編輯出版的《國家通用手語詞彙》共收錄了8000多個常用詞彙，可聆語的詞彙量能達到23000個，掌握的詞彙和語句可以達到160萬。針對2022年冬奧賽事，還涉及很多專業詞彙，為了讓手語主播“聆語”更好地服務賽事解説，騰訊數智人團隊跟專業的老師不斷摸索，去約定和定義專業詞彙，使其能達到聽障人士的可懂度，李學朝告訴記者，“這樣的專業詞彙，我們摸索了15000多個。”

騰訊3D手語數智人“聆語”，最終用“新一代多模態人機交互系統”解決了這一問題，包括後臺騰訊雲小微的解決方案引入語義驅動技術，即根據數智人説話的語義，去匹配對應的動作和字詞。它結合對話AI可以更好滿足客戶的服務場景，對溝通的內容有更細緻的把握，也能在場景中通過肢體語言和表情、聲音更好地傳遞豐富的情感表達，帶來全新的人機交互體驗。

騰訊3D手語數智人“聆語”，在2022年首次完成了數智人在大型賽事中落地應用。前幾日，新智元公佈的一份榜單中，“聆語”憑藉出色表現，成功入圍數字虛擬人Top榜單，也展示了騰訊“雲小微”強大的交互智慧技術能力及産品優勢。

産業落地，數字人如何實現進一步“打工自由”

在騰訊看來，已通過實際的應用驗證了虛擬人這一行業的可行性。但虛擬人産業無論是技術、産品還是産業應用，都還處在起步階段，還需要在各方面進行深入的探索與突破。

目前，騰訊數智人已經在金融、傳媒、政務、文旅、公共服務等場景落地應用，承擔坐席客服、審核面簽、理財顧問、資訊播報、會展主持、導遊導覽等多種角色。

比如在金融領域，騰訊數智人可以成為“金融證券虛擬客服”，支援基於標準化開戶流程智慧引導客戶開戶，為客戶提供高效有溫度的遠端一站式服務。

同時，各個平臺都在進一步降低數字人的應用門檻，力爭讓更多人能夠實現“數字人自由”。

快速發展的行業，往往伴隨著風險。近年來AI被廣泛應用到醫療、金融、工業生産等多個重要領域之中，在幫助各行業提升生産力的同時，也帶來了諸如隱私洩露、決策歧視、模型決策誤判等風險。

日前，在騰訊AI lab、騰訊研究院承辦“人工智慧安全與隱私”論壇上，相關方分享了在可信AI方面的思考。比如找到合適的方法來定量分析、量化人工智慧演算法、模型、系統的穩定性、可解釋性、隱私保護能力及公平性。

李學朝表示，如果人工智慧在上述“可信”度量上都達到很高的共識水準，就有更好的機會做到明確責任、透明可信，並且推動人工智慧在産業上的進一步落地。

此外，數智人由於是多種AI的綜合應用，需要解決挺複雜的技術挑戰以突破行業發展的瓶頸：第一，虛擬人不僅要聽得到、聽得清人類的語言，還需要能聽得懂、説得出，隨著人機交互的體驗和場景的不斷深入，複雜應用場景給技術提出了更高的要求；第二，數字員工類應用需要技術深入結合行業，這類懂行業的複合型人才也是緊缺的。

李學朝進一步認為，未來隨著AI驅動技術的進步，基於新一代多模態人際交互技術的業務型、功能型虛擬人，可以通過整合語音交互、知識圖譜、視覺識別和情緒識別等技術，有效連接資訊和服務、B端和C端，在垂直産業鏈條中提供智慧化服務，以適應更多的行業化、業務化、場景化需求，這將大大拓展數字虛擬人未來的市場空間，並助推這一新興領域的價值躍遷。

[列印] [收藏] [發表評論]

分享到: