2024年08月18日 星期天

數位 > 周邊 > 正文

字號:  

百度推盲人助手“小明”:人工智慧打造生活助理

  • 發佈時間:2015-09-15 17:32:54  來源:中國網科技  作者:佚名  責任編輯:王磊


  百度推出盲人助手“小明” 用人工智慧打造生活助理

  在9月8日的百度世界大會上,百度高級副總裁王勁對外發佈了DuLight,一款幫助盲人感知真實世界的公益可穿戴設備——百度“小明”DuLight,這款産品是由百度深度學習研究院(IDL)牽頭研發,這款智慧助手産品于2015年8月開發完成,依託“百度大腦”的圖像識別、人臉識別、語音識別以及深度學習等相關核心技術,結合百度大數據分析能力和自然人機交互技術,幫助盲人“洞見”真實世界,實現平等的各行各業的日常服務便利,成為盲人的日常生活私人助理。

  人工智慧技術在近幾年已經成為全球大型網際網路公司的必爭之地。Google、微軟、蘋果和Facebook等都在積極進行人工智慧等前沿技術的研發,以改進旗下服務和産品在圖像、視頻及語音處理方面的能力。此前美國知名高科技網站Xconomay的一篇介紹性報道指出,來自中國的搜索巨頭百度,正在成長為全球人工智慧領域的領袖型企業。此次發佈的盲人助手“小明”,可以説是百度在人工智慧領域研發的又一項成果。

  從演示視頻和産品介紹來看,DuLight實際上是一套人工智慧作業系統,對於盲人使用者而言,在家只需手機端安裝,即刻將百度領先的電腦視覺和語音等技術變成身邊觸手可及的生活助理。當需要出門的時候,DuLight也配備一台由百度大腦驅動的智慧可穿戴設備,“小明”的硬體端形態很像藍芽耳機,用戶佩戴之後就可以用語音的方式對“小明”發出指令。“小明”獲取外界資訊的方式除了接受用戶發出的語音指令以外,更多地是通過內置攝像頭捕捉用戶第一視角的視覺資訊,並通過用攝像頭捕捉到的資訊進行圖像識別,隨後通過圖像語義理解對核心資訊進行分析和講解,通過一段時間的使用之後,設備還能智慧推演出用戶下一步可能進行的行為。

  從發佈現場的介紹來看,目前“小明”主要可以實現四個方面的圖像識別功能。圖像識別技術典型的任務包括物體識別、物體檢測、圖像分類標注等,百度通過長期的努力,已經構築了一套比較完整的圖像識別系統,能夠有效地處理特定物體的檢測識別(如人臉、文字以及商品和各類物體)、通用圖像的分類標注、以及主觀圖像品質評估等問題。這次在DuLight圖像技術上尤其凸顯實力的是通用識別功能,這是百度最新研發的“機器讀圖”技術,“小明”可以根據拍攝到的圖片內容自動生成一段描述文字,這項技術基於百度大腦的深度學習技術,在高層語義層面建立了圖像和自然語言之間的橋梁,使電腦能夠真正地學習、建立語言體系,並感知到的物理世界之間的聯繫,可以説是人工智慧領域的一次技術飛躍。

  除了應用了百度IDL領先的機器智慧技術之外,“小明”還可以通過對用戶第一視角的畫面進行視頻直播,讓遠端協助者可以實時看到盲人朋友眼前的狀況,從而幫助盲人朋友即時解決衣食住行等生活問題。“小明”還特別針對人民幣錢幣進行了識別優化,再也不用擔心紙幣上的盲文因使用過多而變得難以通過觸覺識別了。另外,“小明”還配備了人臉識別功能,目前百度的人臉識別的錯誤率僅為0.23%。

  盲人助手“小明”的推出,不僅可以幫助全國近千萬盲人朋友“感知”真實世界,更可以成為新的實體搜索入口。通過對用戶第一視角的視覺資訊進行圖像分析,並結合百度大數據分析能力和自然人機交互技術,“小明”可以為大眾提供所見實體背後的資訊及相關服務,更好地幫助用戶認知世界並連接服務,百度深度學習實驗室的主任研發架構師顧嘉唯提到,伴隨著人工智慧和人機交互技術的不斷發展,從BaiduEye到DuLight,可穿戴設備形態的對話式智慧助理正在走向真實場景。

  • 股票名稱 最新價 漲跌幅