秒懂“弦外之音” 中國智慧語音技術取得新突破

   人工智慧日益“火熱”,可目前的智慧語音技術,機器還不能充分理解自然語言,聽懂“弦外之音”的情景僅存在於科幻作品中。但這正在起變化!

  
  國內最新的智慧語音技術成果表明:機器已能以較高的準確率實現語音轉化文字、多語種同步翻譯、甚至模倣某個人的聲線講話,以假亂真。

3.png

  秒懂“弦外之音” 精準識別同步翻譯
  
  在上千人的會場,多位嘉賓近3小時的演講交流,全程無速記員,演講內容卻能實時轉成文字顯示在大螢幕上。
  
  新華社作者23日在科大訊飛年度發佈會上看到,除了演講中個別人名地名的差錯,以及説話者口語表達中冗余的詞彙外,絕大部分演講內容都被整理得非常準確,並能同步翻譯成英、日、韓等多種語言。
  
  在智慧車載系統的展示中,面對駕駛員任性地打斷、隨意地插話,車載系統竟通過上下文語境“秒懂”駕駛員意圖,甚至對故意“刁難”的極簡指令,也能迅速聽懂“弦外之音”,導航、聽歌、團票都不在話下。
  
  據介紹,這些都是基於深度神經網路的語音識別技術來實現的。語音識別技術,簡單説就是讓電腦“聽懂”人類的語音,將語音中包含的文字資訊提取出來。該項技術在智慧電腦系統中扮演著重要角色,相當於給電腦裝上了“耳朵”,使其實現人機通信和交互。目前語音識別準確率可達到97%。
  
  “隨著萬物互聯時代到來,以語音為主、鍵盤觸摸為輔的人機交互正逐漸成為剛需。未來5到10年,人工智慧會像水和電一樣成為我們生活的必需品,深刻改變我們的世界。”科大訊飛董事長劉慶峰説。
  
  語音合成“以假亂真” 聲音也可被“盜”
  
  聰明的機器人要能聽會説,語音合成技術就是“讓機器像人一樣開口説話”,它是涉及聲學、語言學、數字信號處理、電腦科學等多個學科的一項資訊處理的前沿技術。
  
  中國工程院院士、中國人工智慧學會理事長李德毅表示,在人工智慧領域,對話是目前最直接、最便捷的交互方式,對話智慧是幾乎所有服務機器人的必備技能。
  
  讓機器人“開口”説話的技術並不新鮮,電子萬年曆、計算器上都能用得到,但要像人一樣説得自然流利、有聲調起伏,並非易事。
  
  作者在現場用手機試用科大訊飛開發的語音合成軟體,發現語音合成功能不僅能將文字資訊轉化為可聽的聲音資訊,還能將某個人的聲線特徵收入語音庫中,然後用很短的時間將文本用被模倣者的聲線特點讀出來,確有以假亂真之效。未來,人們的聲音也可能存在被“盜”用。
  
  目前,中國在智慧語音技術上已經實現了5到8米的遠場識別、多輪交互對話、免喚醒詞交流、交流隨時打斷等多項突破,人機交互越來越流暢自然。
  
  “不僅中文語音合成技術取得突破,在今年的全球語音合成大賽中,科大訊飛的語音合成技術能夠聲情並茂講英文故事,在多種語言的測試中表現不俗。”劉慶峰説。
  
  人工智慧如何改變世界?
  
  如今,以智慧語音技術為主的人工智慧已在手機、教育、傢具、汽車、醫療、服務機器人等多個領域顯示出巨大的應用潛力。
  
  今年1月,日本提出超智慧社會的發展規劃;10月,美國出臺人工智慧産業規劃。發達國家已經在思考人工智慧可能帶來的風險、人工智慧如何實現人和機器相互融合、人工智慧相關法律等問題。
  
  今年4月,我國由工信部倡導、國內多家企業聯合發佈了《人工智慧深圳宣言》,宣言除了強調人工智慧必須要做源頭技術創新、人工智慧要有標準外,同時也強調積極探討人工智慧技術發展與倫理道德的平衡點,讓人工智慧更好地服務人類。
  
  中國行動通訊集團公司副總裁李正茂表示,基於人工智慧技術的機器人很可能成為繼手機之後下一個超過全球人口總數的電器産品,未來機器人市場規模可能突破百億。
  
  對人工智慧技術,一邊是美好的暢想,一邊是謹慎的擔憂。著名科學家霍金認為未來人工智慧會替代甚至奴役人類,近來備受熱捧的《西部世界》《黑鏡子》等影視作品也都表達出對人工智慧和未來科技的擔憂。機器人威脅人類是杞人憂天嗎?
  
  未來正在改變,沒人能預測未來,可人工智慧技術前進的腳步不會放緩。

未經允許不得轉載:網信浙江 » 秒懂“弦外之音” 中國智慧語音技術取得新突破

微信二維碼,掃一掃關注

相關推薦