新聞源 財富源

2024年12月20日 星期五

財經 > 滾動新聞 > 正文

字號:  

多用途唇讀新技術可助聽講話內容

  • 發佈時間:2016-03-29 01:29:34  來源:科技日報  作者:佚名  責任編輯:羅伯特

  科技日報北京3月28日電 (記者常麗君)據英國東英吉利大學消息,該校科學家開發出一種新的唇語閱讀技術,不僅有助於解決犯罪調查問題,也給那些在聽力和講話方面有困難的人帶來幫助。研究人員在近日于上海召開的“國際聲學、語音和信號處理大會”(ICASSP)上介紹了這一成果。

  新的視覺語音識別技術由東英吉利大學計算科學學院海倫·L.拜爾博士和理查德·哈維教授開發,可以用在“任何憑聲音難以確定人們在説什麼的地方”。拜爾説,當無法獲得聲音時,如何確定人們的講話內容是個獨特的問題,比如閉路電視的註腳,或者聲音不足又沒有對話語境的線索。但現在,通過機器唇讀分類技術,能更精確地區分這些聲音。

  拜爾説,一種穩定的唇讀系統能用於從犯罪調查到娛樂用途等多種情況。唇讀還可以用在運動場上,比如足球運動員在比賽激烈時大喊大叫的單詞是什麼,但最可能的實際用途還是在那些噪音較大的地方,比如汽車中或飛機駕駛艙內。

  研究人員使用了一種新的訓練方法,使這種分類系統對以往的唇讀方法進行了改進。雖然目前這一系統還有需要改善的地方,但最重要的是,它可以通過調整來用於多種目的,比如給那些有聽力障礙或講話困難的人帶來幫助。此外,一個好的唇讀機可以作為整體視聽識別系統的一部分。

  哈維也指出,在人工智慧領域,唇讀是最具挑戰性的難題之一,訓練機器如何識別人類嘴唇的形狀和變化並非易事,所以這方面取得的進步非常重要。

  相關論文將發表在電氣與電子工程師協會(IEEE)《2016年國際聲學、語音和信號處理大會會刊》上。

熱圖一覽

  • 股票名稱 最新價 漲跌幅