新聞源 財富源

2024年12月20日 星期五

財經 > 滾動新聞 > 正文

字號:  

人工智慧領域新突破百度發佈基於深度學習的線上翻譯系統

  • 發佈時間:2015-05-29 01:33:24  來源:北京晨報  作者:佚名  責任編輯:羅伯特

  日前,百度在機器翻譯技術上取得重大突破,發佈了融合統計和深度學習方法的線上翻譯系統。該系統借助電腦模擬的海量神經元,模倣人腦“理解語言,生成譯文”,同時結合百度已有的統計機器翻譯技術,使得機器翻譯品質實現了質的飛躍。

  此次百度發佈的基於深度學習的線上翻譯系統,實現了類似人腦的“理解語言,生成譯文”的翻譯方式。這種翻譯方法最大的優勢在於譯文流暢,更加符合語法規範,容易理解。

  據了解,百度利用自身得天獨厚的龐大網頁庫資源,挖掘了海量的雙語句對,作為系統的“學習教材”。由於深度神經網路結構極其複雜,整個學習過程非常耗時,需要持續很長時間。百度機器翻譯團隊經過技術攻堅,使得翻譯系統的學習效率提高了十幾倍,大大縮短了學習時間。

  百度新發佈的翻譯系統應用了長短時記憶(LSTM, Long Short-Term Memory)的迴圈神經網路深度學習技術。該模型擅長對自然語言建模,把任意長度的句子轉化為特定維度的浮點數向量,“記住”句子的全部語義。LSTM模型側重於“記憶”那些比較重要的單詞,讓“記憶”保存比較長的時間,對於那些不太重要的單詞,則會儘量早地“忘記”它,把寶貴的資源留給更重要的詞。該模型很好地解決了自然語言句子向量化的難題,對利用電腦來處理自然語言來説具有非常重要的意義,使得電腦對語言的處理不再停留在簡單的字面匹配層面,而是進一步深入到語義理解的層面。

  一直以來,百度在機器翻譯領域堅持技術創新,不斷提升翻譯品質和系統性能,致力於大規模網際網路應用,為廣大用戶提供高品質、方便快捷的翻譯服務。依託海量的網際網路資源和自然語言處理技術的優勢,百度研發出高品質翻譯知識獲取技術,突破了傳統方法在翻譯知識獲取方面規模小、成本高的瓶頸;基於網際網路大數據的多策略翻譯模型,能夠實時響應用戶複雜多樣的包括網路新詞、科技文獻、電子商務、古文、粵語等多領域、多文體的翻譯需求;基於樞軸語言的翻譯方法,使得資源有限的小語種翻譯成為可能。

  百度機器翻譯團隊一直秉承讓所有人平等便捷地獲取資訊、找到所求的使命,致力於消除用戶跨語言溝通交流的障礙。結合百度領先的圖像識別、語音識別等技術,“百度翻譯”APP為用戶打造了一個全方位的隨身翻譯官。這位“翻譯官”不僅可以幫助用戶實時地與外國人進行面對面交流,根據用戶所處場景,智慧推送實用口語例句,還可以通過攝像頭拍照對功能表、車站站牌等進行翻譯,解決用戶在海外學習和旅行時的語言難題。劉松

熱圖一覽

  • 股票名稱 最新價 漲跌幅