靈雲遠場語音識別服務智慧家居、車載
- 發佈時間:2015-12-16 12:10:09 來源:光明網 責任編輯:書海
最近一段時間,捷通華聲旋風般相繼推出靈雲遠場語音識別、語音喚醒、聲源定向等關鍵技術,在引起産業界廣泛關注的同時,16日正式宣佈推出面向智慧終端的完整靈雲遠場語音交互解決方案,該套方案完美整合了國內最新遠場語音識別、語音喚醒、聲源定向、降噪、回聲消除、端點檢測等更多項技術,為智慧車載、智慧家居、家電、機器人全面應用語音識別、語音合成等智慧語音交互技術開闢了全新的方向。
靈雲遠場語音識別解決方案的推出,徹底打破了各種設備應用自然語音交互技術的産業瓶頸,讓每個人都能實現通過自然語音輕鬆控制車載、家居、家電等各種設備的科幻夢想,為全面提升我國車載、家居、家電、機器人等設備智慧化水準,讓中國億萬大眾率先進入智慧化生活時代奠定了堅實的基礎。
靈雲遠場語音交互只用語音就夠了
很長一段時間以來,科大訊飛、NUANCE等語音技術公司都在努力開拓智慧硬體市場,但智慧硬體産品在很多場景下因語音交互體驗不如人意而不能滿足市場的需求,究其原因主要是受限于背景噪音、回聲、混響等多重復雜因素,進而造成必須要近距離識別而且識別率低等明顯痛點,成為語音識別技術在各種終端設備應用中一直無法突破的瓶頸。
捷通華聲順應産業強烈需求,憑藉多年潛心研究所積累,與車載、家電、機器人等廠商持續合作,在清華大學的支援下,終於推出了完美整合語音喚醒、聲源定向、降噪、回聲消除、端點檢測、智慧語音交互等先進技術在內的靈雲遠場語音交互解決方案,該套解決方案為國內最全、最完整的智慧語音交互解決方案,必將極大促進智慧語音交互技術在真實生活場景中的應用。
家電等智慧終端首先需要由語音喚醒來“叫醒”,才能進一步交互,沒有被“叫醒”功能的終端將無法繼續使用語音交互來控制。當設備被叫醒後,通過聲源定向技術,在目標説話人方向形成拾音波束,讓麥克風始終指向目標説話人,減少外界噪音的錄入。接下來對獲取到的聲音進行降噪及回聲消除處理,使獲取到的聲音更純凈,當説話人停止説話時,通過端點檢測技術,監測到語音尾部,後續靈雲遠場語音識別能力將顯示它巨大的威力,可以想像,基於靈雲遠場語音識別的遠距離、高識別率支撐,現在用戶在以家庭為單位的活動範圍內,幾乎可以通過語音輕鬆操控家裏的一切智慧硬體設備,推而廣之,搭載遠場識別的智慧硬體産品將無限擴大適用範圍和應用場景。同時,靈雲遠場語音交互解決方案得到靈雲內容平臺的全面支援,為智慧終端增添了天氣諮詢、日曆查詢、列車查詢、航班查詢、餐館位置查詢、電話撥打、電話號碼尋找、短信收發、音樂及視頻播放控制、導航、車載指令等30余種內容的支援,更進一步改變了智慧終端語音交互僅能“發號施令”的弊端。
例如,在智慧家居中,利用靈雲語音喚醒能力可以喚醒電視、冰箱、洗衣機、空調等智慧家居設備,再實現語音交互功能。當電視處於待機狀態時,講一聲“小靈,啟動電視”,電視將立即啟動並播放節目,此時,電視的聲音會導致有回聲出現,而有了靈雲回聲消除技術,將會把電視聲音過濾,僅保留目標説話人聲音,只要再講一聲“我想看中央一台”,電視將自動切換到中央一台。
在智慧車載領域,靈雲遠場語音交互技術可以為車載終端控制、車輛控制等服務。在路上行駛時,無論是汽車行駛過程中産生的胎噪還是外界噪音都非常大的,而靈雲降噪技術通過對車輛資訊的深度了解,及外界環境噪音的處理,能夠準確的識別司機或乘客的語音命令。由於新手司機上路越來越多,雨天及夜晚等特殊情況開車時,會因為大燈、雨刮器等功能性設備打開與關閉導致手忙腳亂,甚至會導致錯把油門當剎車、剎車當油門的事件發生。而靈雲遠場語音交互技術的運用,不但可以控制車載,還可以控制車上各種設備。在夜間開車時,可以直接説“小靈,打開/關閉遠光”來控制車燈,也可以説“小靈,播放音樂”來緩解駕駛疲勞,讓語音技術隨時服務於行車的整個過程。
在機器人領域,人們會站在各個角度與機器人對話,此時靈雲聲源定向將引導機器人轉向説話人所在位置,再通過靈雲人臉尋找技術來確定説話人,當説話人一句話説完後,靈雲端點檢測技術將確定一段語音結束,並將語音傳給靈雲遠場語音識別確定命令或進行交互。
隨著智慧硬體的普及,靈雲遠場語音交互解決方案更是大放異彩。智慧硬體使用場景一般都是環境嘈雜,距離忽遠忽近,而且大部分時間智慧硬體將以低功耗的狀態運作,等待語音喚醒。在種情況下,語音喚醒、降噪、遠場識別等技術的應用,能有效的讓智慧硬體“聽清”語音,從而執行指令或回答問話。
2014年,為讓國內智慧車載、智慧家居等智慧終端廠商與整合商、開發商更方便地使用靈雲平臺(hcicloud.com)全方位人工智慧能力,捷通華聲特別推出了企業級開發者專用的智慧終端交互方案:靈雲種子。靈雲種子強化了靈雲全方位人工智慧平臺各項人工智慧技術的融合,包括靈雲語音識別、語音合成、語義理解、聲紋識別、人臉識別、指紋識別等全方位人工智慧交互能力,並提供簡單易用的開發介面,供智慧家居、車載等各類智慧終端進行整合調用,實現人與終端設備多種方式的自由溝通和控制。企業級開發商通過應用靈雲種子,可以輕鬆實現智慧語音交互、智慧語音導航、智慧語音控制、聲紋解鎖、手寫輸入、智慧圖像識別、安全身份認證等多種人機交互功能,滿足智慧家居、智慧車載、智慧家電、機器人及可穿戴式設備等各個行業對人工智慧技術應用大量且多方位的需求。
據悉,靈雲遠場語音交互已經應用在靈雲種子中,靈雲平臺還將陸續推出更多能力,為各行各業智慧終端不斷提供新的技術,推動中國智慧終端産業將進入一個全新的、真智慧的時代!
靈雲平臺服務智慧終端合作共贏
靈雲平臺(hcicloud.com)是捷通華聲于2011年推出的首個全方位人工智慧開放平臺。為推動人工智慧産業的廣泛應用,靈雲平臺自推出以來一直面向産業全面開放,包括個人開發者在內的合作夥伴,都可以通過靈雲平臺獲取智慧語音、智慧圖像、智慧語義、生物特徵等技術能力。
捷通華聲為更好服務智慧終端各領域合作夥伴,在全國各地建立分公司與辦事處,尤其在中國華南的廣州、深圳地區經濟發達、創新力強,在智慧車載、智慧家居、機器人、穿戴式設備研發與創新上擁有獨特優勢。為了向華南地區廣大合作夥伴提供更加直接的支援與幫助,捷通華聲2015年在深圳、廈門等地成立了分公司,旨在依託靈雲平臺,利用靈雲平臺智慧語音、智慧圖像、語義理解等全方位人工智慧技術能力和豐富完善的智慧終端交互解決方案,與華南地區智慧車載、智慧家居等智慧終端廠商加強合作關係,發揮華南地區智慧終端設備研發和生産的優勢,期望通過與各領域合作夥伴的精誠合作,互惠共贏,共同推動中國智慧終端産業的發展進步!
未來發展,捷通華聲將繼續以清華大學人工智慧研究力量為依託,更加專注智慧語音等人工智慧技術研究與産業化的推廣與應用,與合作夥伴精誠合作,共同創建良好的人工智慧産業生態,共同推動中國人工智慧産業的發展進步,為中國人工智慧産業的發展做出應有的貢獻!