2024年09月01日 星期天

車載智慧語音 好多人都做錯了

發佈時間:2015-05-26 11:22:49  來源:車音網  作者:佚名  責任編輯:王庭

  從點擊到觸屏,再到語音,技術的升級也見證了人機交互從一個時代走向另一個時代。隨著人們需求和認知得到提升,越來越多的人認定,語音是未來智慧化的方向,一大批企業也殺入了這一領域。但在鏖戰之餘,一個問題也浮現出來——我們應該做什麼樣的語音産品,該如何滿足消費者的需求?在5月21日舉行的“蓋世微課堂——智慧語音産品在汽車上的應用與發展趨勢”活動上,車音網聯席CEO王力劭與蘇雨農,就向300余名業內人士分享了車音網對智慧語音未來發展的看法。

  有取有舍 好用才是王道  提到車載智慧語音産品,人們頭腦中的第一印象一定是“高科技”。不過就像大多數學者對“技術決定論”的批判一樣,智慧語音的高大上,並不意味著它能獨立於人的意志而存在。

  “語音技術出身的科學家及車載産品經理,可能會陷入技術化的思維”,車音網聯席CEO王力劭坦言。正如他所説,語音技術的應用會面對類似感性思維和理性思維的困擾——到底是根據“我有什麼然後做什麼”的思維,還是用戶的需求來做産品。在這一點上,車音網的看法很明確,智慧語音産品真正要解決的痛點並非技術本身,而是對需求的把握。用戶所要的,並非技術多麼高級,而是這個技術能否按照要求去完成任務。

  在目前的車載語音産品開發中,語音的“識別率”往往被放在了核心位置上。但在車音網看來,服務的“達成率”才是真正的硬指標。而車載智慧語音産品要真正做到人性化,需要聚焦的一個重點問題就是應用場景。在適合的場景下,語音才能發揮它最大的效用。車音網聯席CEO蘇雨農談道:“語音並非萬能,作為便捷的工具,語音所能實現的功能應該更聚焦、更有保障。在很多情況下,語音産品並非不能識別用戶的指令,而是沒有必要識別。”例如,在車載環境下,撥打電話這樣的功能就是合適的應用場景,而用語音開關車窗,用戶體驗就遠遠不及使用機械按鈕的方式。在訪談中,蘇雨農和王力劭表示,産品的設計不能陷入技術化的思維,要真正考慮用戶對語音的核心需求,必要時甚至要用上“去語音化”的解決方案。

  車載智慧語音産品 未來的技術重點是什麼?

  無論是“去技術化”的思維,還是“去語音化”的解決方案,都是在産品素質過硬的基礎上,對用戶需求滿足的更深層思考。無論如何,智慧語音産品都離不開對技術的修煉。儘管車音網建立於2008年,但其技術團隊早在近20年前,就開始了語音識別技術的研發。對於智慧語音技術的發展方向,車音網有著自己的心得。

  首先,語音識別與硬體密不可分。要想實現完美的用戶體驗,簡單地把語音識別引擎和硬體車機綁在一起是不夠的。麥克風陣列排布以及車機設計,都會影響語音識別的效果,而這也是未來語音識別重點探索的方向。為了讓語音識別更加精確,降噪技術、後臺引擎垂直度以及訓練與車載環境的結合度,也都是需要注意的。

  其次是語音識別的容錯性。具體説來,它分為對聲音的容錯與對資訊的容錯。現實生活中,對於突如其來的噪音以及無意識的口誤,語音技術能否結合搜索技術並做到容錯是非常關鍵的。此外,語音技術還要能夠聽懂各地方言或各種表達方式。對於用戶而言,往往會追求多樣性,包括使用過程中偶然狀況的多樣性以及場景的多樣性等,針對上述多樣性,容錯技術也顯得尤為重要。

  另外,語音技術完成識別之後,還需要進行自然語言處理(NLP)和搜索,通過對自然語言的處理和理解,加上搜索技術和正確的返回資訊,一個巨大的數據庫或知識庫得以形成,這種數據庫或知識庫可以針對語音識別的結果提供反饋資訊。在用戶看來,既然説的話被識別,其返回來的結果就應該正確,而不會去糾結識別出錯抑或搜索出錯,因此自然語言處理和搜索這兩項技術的成熟度,也直接影響了語音識別技術的反饋結果。

  第四,雲系統將會成為未來的主流趨勢。隨著移動網路頻寬不斷提升,資費逐漸降低,雲系統的優勢將逐漸體現。依託大伺服器群、大模型、大併發,雲系統能提供更好的語音識別能力和語義分析能力。而嵌入式晶片因為設備局限性,提升能力有限。不過,王力劭也提到,目前雲端與本地混用的模式是可行的,例如打電話的場景,本地化的解決方案就能很好的滿足需求。

  最後,從設計體驗角度來看,目前對於技術出身的設計者往往是從自身設計角度出發,只關心語音能做什麼,從而導致語音設計存在一定的問題。任何語音識別的模型都存在一定的局限性,而且語音技術本身是一項概率技術,即使該技術能夠做到精準,外部的不可抗因素也可能會導致語音識別失效。設計者應該更多地以用戶的應用場景以及應用需求為出發點,去開發及設計語音産品。

  智慧語音應如何盈利?

  盈利模式是維繫一個産業發展的命脈。無論智慧語音如何夢幻,沒有盈利模式,它也只能是空中樓閣,如水中月鏡中花,最終化為烏有。

  縱觀所有行業,目前盈利模式主要分為傳統模式以及網際網路模式兩種。兩種模式的根源主要是圍繞從技術出發還是從盈利角度或未來價值實現角度出發點,具體的模式主要分為産品售賣、服務租賃、影響力尋租,以及“東邊不亮西邊亮”式,即從其他領域獲得更高的收益值。

  在語音識別的應用中,如果不能將其影響力傳遞給使用者,那麼語音技術和語音平臺如何去謀求長遠的利益轉化,值得我們思考。解決方法分為兩種:

  ·將語音作為一種手段,重點垂直紮根于行業中。

  ·從語音技術本身去謀求營利,將免費開放平臺轉化成最終利益。

  車載智慧語音的哲學

  可以説,近年來車載智慧語音的研發與應用已經變成了一股浪潮。企業的蜂擁而上,讓這一行業顯得格外繁榮。但在蘇雨農和王力劭看來,我們應該十分清醒地看待智慧語音的發展,切實將用戶需求放在首位,摒棄為技術論的思維,才能為消費者奉獻出他們想要的産品。

  “總之,我們要善用語音,慎用語音,垂直聚焦,體驗為上”,王力劭總結道。或許,這就是車載智慧語音産品的真諦。

  • 股票名稱 最新價 漲跌幅