新聞源 財富源

2024年12月19日 星期四

財經 > 滾動新聞 > 正文

字號:  

讓中國語音響遍世界

  • 發佈時間:2015-04-21 05:20:10  來源:經濟日報  作者:佚名  責任編輯:羅伯特

  司機小楊沒有想到,這段時間伴他一路同行的“志玲姐姐”語音導航服務中,“女神”甜美的娃娃音竟然大部分是合成的!同小楊一樣,很多人不知道,高德導航應用中除“向左轉彎”“前方攝像頭”等固定語句採用原聲外,地名、距離、速度等提示也是依據林志玲咬字和發音方式,運用語音合成技術製作而成。這一技術提供商正是有“中國語音産業國家隊”美譽的科大訊飛

  從被外界譏笑的“草臺班子”到亞太地區最大的語音上市公司,從中國語音産業的拓荒者到世界語音産業的領軍者,16年來,科大訊飛以源源不斷的自主創新經受住市場的淬煉,詮釋了什麼是産業報國,何為鳳凰涅槃。

  放開被掐住的喉嚨

  或許你曾看過這樣一段視頻:一名山東大漢開車時試圖用語音控制功能的車載設備撥打電話,但他一口濃郁的山東方言讓設備屢屢識別錯誤。幾次糾正無果後,大漢準備再試一次,沒想到此時設備竟然説出了“謝謝,再見。”大漢哭笑不得。

  用語音撥打電話不靠譜,還是方言不易被識別?在另一段視頻中,一位山東女士用同樣的方言,撥打同樣的號碼,結果迥然不同,她用的APP是訊飛推出的靈犀智慧語音助手。

  “現在靈犀已率先支援粵語、四川話、河南話、東北話、天津話、湖南話、山東話等14種方言。”科大訊飛媒介經理陳衛民告訴記者。

  不僅如此,雙手忙不過來時,跟它説一聲,立即代你打電話、發短信;出國旅行不會講英語?一秒之內實現中英輕鬆互譯,幫你讀出;隨意哼個小曲,即刻顯示歌曲名字,陪唱陪練;一聲令下,打開窗簾、關閉檯燈、電視換臺,一切如你所願。在科大訊飛的産品體驗廳裏,實現這些你只需耍耍嘴皮子。

  看著今天的科大訊飛在語音市場上的縱橫馳騁,可能有人嘆息生不逢時,沒有像它一樣幸運。但鮮為人知的是,彼時科大訊飛選擇中國語音産業化之旅,在別人看來簡直是異想天開。

  質疑並非毫無來由。1999年科大訊飛成立伊始,中國語音市場幾乎百分之百由IBM、微軟等國外IT巨頭壟斷;而在國內,雖有科研機構從事相關研究,卻都是單打獨鬥,遲遲未見成果面市,更令人不安的是,語音技術人才畢業後進入跨國公司幾乎成了一種慣例。

  這樣的背景下,胡鬱、胡國平、陳濤,還有科大訊飛發起者——彼時26歲的中科大博士研究生劉慶峰,一群尚未完全擺脫稚氣的毛頭小夥子偏偏要試一試。語音是文化的基礎和民族的象徵,不能被外國人掐住喉嚨!中國的語音産業要由中國人來掌握。這個只有18個人的團隊開始了跌跌撞撞的語音産業化苦旅。

  2003年,科大訊飛榮獲“國家科技進步獎”,牽頭制定具有自主智慧財産權的中文語音標準;2006年至2014年,連續9年在英文語音合成國際大賽中奪冠;2008年摘得國際説話人識別評測大賽桂冠,並在語音識別技術領域一舉超越全球最大的語音技術公司Nuance;2009年獲得國際語種識別評測大賽高難度混淆方言測試指標冠軍;2013年,通過麥克風陣列技術將語音識別的距離拓展到5米以外,在高抗噪語音識別技術領域取得突破,100km/h車速下仍保持90%以上的識別率,顯著領先;2014年,繼續獲得通用全球中文語音識別測評綜合指標第一名。

  而在與語音技術平行的另一條歷史軸線上,科大訊飛的語音産業化之旅也愈走愈順:2008年成為中國語音産業唯一的上市公司,將Nuance“擠出”中國;如今為全行業2000多家企業提供語音核心技術,佔據中國語音主流市場70%以上的份額,並成為亞太地區最大的語音公司;面向移動互聯網時代率先推出語音雲平臺,用戶數已突破6.8億,開發應用申請超過6萬個,逐步形成以科大訊飛為核心的語音産業鏈,成為業界公認的“語音産業國家隊”;目前,訊飛語音學習軟體已在國外孔子學院得到普遍應用,並成為新加坡等國中英文語音學習門戶的主流技術。

  很多業內人士都對科大訊飛豎起大拇指:“如果沒有科大訊飛,中國語音産業現在還會控制在國外公司手中,也不可能有今天的蓬勃發展。”

  彎曲的直線

  一系列耀眼的成績背後,用劉慶峰的話説是一段“走彎曲的直線”的創業歷程,所謂直線即目標明確,彎曲則指實現夢想的過程曲折。

  劉慶峰深有體會地告訴記者,“任何創新都是一個痛苦的過程,是不斷試對與試錯的相互交織。”成立之初,市場很快就給了科大訊飛一個“下馬威”。他們自主研發的一款名叫“暢言2000”的電腦軟體遇冷。

  這是一款劉慶峰曾十分看好的産品,它能將語音自動轉換成文字,並讓用戶通過語音控制電腦,主要面向老年人。但不久他們就發現這款産品叫好不叫座。“我們忽略了一些因素,一方面當時盜版軟體倡狂,另一方面我們的主要消費者為老年人,其電腦操作經驗太少,有的電腦還沒開就説軟體出了問題呼叫售後服務,這樣折騰兩三次後,利潤就沒了。”劉慶峰説。

  “吃一塹長一智”。這次的教訓讓科大訊飛明白:直接進軍大眾消費市場時機還不成熟,必須轉攻企業級用戶。

  於是,當中國電信計劃將168電話資訊平臺鋪向全國之際,科大訊飛毛遂自薦為其提供語音合成技術。但就在他們對實驗結果滿懷信心時,消息傳來:對方拒絕合作,理由很簡單,科大訊飛也就是個創業團隊,這麼大的單子不敢交付。

  又是當頭一棒。更糟糕的是,還禍不單行。

  期間,資金鏈的斷裂讓股東及團隊內部炸開了鍋,質疑聲不絕於耳。“語音技術到底前景有多大?”“是不是應該做別的應用軟體?”“是不是給銀行做伺服器更賺錢?”面對動搖的軍心,劉慶峰將大家拉到巢湖邊上開會,並放出一句狠話,“誰不看好語音,就請誰走人!”

  那天起,訊飛人達成了一個共識:語音産業需要長期的技術積累,快餐式的急功近利無法長久。

  隨後,劉慶峰多次赴深圳找中國電信168合作方華為懇談,或許被他的誠意感動,華為同意在其平臺上試用訊飛的語音技術。可是,反饋結果卻讓他有些無地自容:系統相容性不強、語音合成不自然、連續性差……對於這份充滿硬傷的測試報告,華為表態,“一週內解決所有問題,否則合作失效。”

  當然,這次他們成功了——自此,科大訊飛成為華為在語音方面唯一的合作夥伴。10多年後在科大訊飛15週年慶典時,輪值總裁吳曉如回顧了這場攸關生死的大考驗。“這個星期,沒有一個人離開過辦公室,大家幾乎不眠不休,最後全部問題迎刃而解。我清晰地記得走出辦公室時大概是下午4:30左右,回到家倒頭就睡,一直睡到第二天的中午。”

  艱難困苦,玉汝于成。接下來科大訊飛拓展了包括華為、中興和聯想在內的50多個合作夥伴,並如願獲得第二輪融資。

  聯想投資成立後的第一筆投資就給了科大訊飛。不過,有一年聯想投資財務經理參加其半年度經營會議後卻拉長了臉,“沒想到訊飛的財務狀況這麼差。”科大訊飛這一隻見投入不見産出的態勢一直延續了5年。

  正是這種耐得住寂寞的堅守,2004年科大訊飛迎來轉機——扭虧為盈,並從2005年至2007年保持凈利潤130%的複合增長。2008年科大訊飛上市。

  時至今日,科大訊飛已成為當之無愧的語音界霸主,其在國際市場上僅次於Nuance,而面向行業用戶提供“軟體+服務”的整體解決方案正成為他們進行市場探索的一個重要方向。

  讓機器會説會思考

  大浪淘沙,十幾年來國內外的語音公司生生滅滅,失敗者居多。在這場後來居上的戰役中,科大訊飛何以華麗逆襲?

  個中原因,劉慶峰心裏十分清楚,“語音是典型的高技術交叉學科,涉及數字信號處理、聲學研究和實驗語音學等諸多領域,若想取得實質性突破,必須有效整合核心技術資源。”

  科大訊飛創立初期,國內幾大語音研究機構各有建樹,但各自為政、相互封閉,如何整合?2000年首輪風險投資後,劉慶峰做的第一件事就是逐個拜訪“語音大牛們”,用這筆資金與中科院聲學、中國社科院語言、中科大成立語音技術聯合實驗室。他承諾,“各自專注于其擅長的研究,科大訊飛提供專項科研經費並負責産業化整合,給他們股權,實現成果共用。”

  如此一來,早期在品牌、市場等方面都不佔優勢的科大訊飛就有了一支強大的技術後盾——對聲音合成和聲音聽辨方面有獨特研究的孫金誠研究員;1980年就從事人機語音通信的王仁華教授;社科院語言所對聲音、語氣、語調等研究了40多年的吳宗濟老專家。事實證明,這筆“技術投資”為科大訊飛日後攀上語音技術的峭壁奠定了堅實的基礎。

  在有效整合外部資源的同時,科大訊飛也沒忘苦練內功。“我們要比科學界更知道技術的發展趨勢,比消費者更知道他需要什麼。”於是,科大訊飛高級副總裁、研究院院長胡鬱和團隊建立了三個梯次的佈局:聯合實驗室傾向於技術的基礎研究,訊飛研究院負責面向産品的應用研究,訊飛各事業部的産品部門負責把方案進行代碼級的優化,變成完善的産品。與此同時,保證研發投入,“今年我們的研發支出預算要佔到銷售收入的30%。”劉慶峰透露。

  戰略就像望遠鏡,能看清很遠的方向,但不能縮短腳下的路程。憑藉一流的技術和腳踏實地的努力,科大訊飛近年來逐步贏得市場和用戶的認可。

  但對科大訊飛來説,他們的夢想“讓機器能聽會説、能理解會思考”才剛剛起步。眼下,第一個目標已經實現。胡鬱説,在繼續改進語音技術的同時,科大訊飛已于近期啟動了“訊飛超腦”計劃。“我們希望未來機器可以像人一樣,不僅能聽會説,還能理解會思考,有邏輯思維和推理能力。”胡鬱表示。他透露,“訊飛超腦”目前已聚集了語音及語言資訊處理國家工程實驗室、加拿大約克大學等10多位人工智慧領域頂級專家。

  他們還努力將語音應用範圍盡可能地拓展。劉慶峰告訴記者,科大訊飛正在研究如何將聲紋技術和人臉識別技術結合,“人的聲音和DNA、指紋一樣,具有唯一性,是可識別的,如果再與人臉識別疊加在一起,作為身份的驗證碼,那麼未來身份證或將不再需要,辦理一些事只需張張嘴、掃掃臉即可。”

  這些設想還需多久能夠實現?劉慶峰不十分肯定,但他們的目標是成為谷歌那樣的創新型公司,用技術改變世界。

熱圖一覽

高清圖集賞析

  • 股票名稱 最新價 漲跌幅