新聞源 財富源

2024年12月20日 星期五

財經 > 滾動新聞 > 正文

字號:  

學抓物,練調酒,學習軟體做幫手

  • 發佈時間:2015-10-27 01:31:15  來源:科技日報  作者:佚名  責任編輯:羅伯特

  本報記者房琳琳綜合外電

  機器人在現代製造業上發揮著不可替代的作用,然而,更安全、更便宜特別是更智慧的機器人還是供不應求。

  隨著材料科學、電腦科學、大腦科學等領域的快速發展,機器人雖然距離科幻電影中的形象還相去甚遠,但隨著“學習”能力的不斷提升,開發和拓展機器人與現實世界互動的科技實踐,卻無時不刻震撼著你我的眼球。雖然,每一次學習都只進步了一點點,但正是這“一點點”的進步,終將匯聚成未來的智慧世界。

  美國《麻省理工技術評論》10月份以來發佈了幾篇有關機器人學習能力新動向的文章,或許對機器人發燒友來説,是個有趣的、跟蹤最新技術方向的重要參考。

  “自學”抓取多種物品

  一般用途機器人的目標之一,就是與日常生活中的物品以智慧的方式互動,但是機器人的抓取能力實在差到令人尷尬。讓機器人撿起一個電視遙控器、一瓶水或者一個玩具槍,它都會無休止地去摸索,除非再編制一個讓它在特定環境下撿起特定物品的程式。

  這與人類抓取東西的能力形成鮮明對比。一個人類嬰兒能夠在最混亂和非結構化的環境下,快速學會抓取特定的物品。

  那麼,機器人能像嬰兒那樣通過反覆試驗和糾錯來學習抓握嗎?

  如今,卡耐基梅隆大學的裏瑞爾·平托和阿波西納威·敢普塔證明了這種可能性。他們為名為巴克斯特的機器人裝載了深度學習功能,讓它在堆滿了一桌子的日常物品中,像嬰兒那樣坐在桌子前的高椅上自己學習。

  巴克斯特是一個現代化的兩臂工業機器人,被設計成可在工廠車間環境下執行重復性任務。它的每個胳膊都由一個標準的兩指平行爪和一個能讓機器人看清楚去抓什麼的高清攝像頭,它還有一個微軟Kinect感測器,提供一覽無余的視角。

  平托和敢普塔為巴克斯特編程,通過與其他“鄰居”隔離的方式單獨抓取一個物品,然後在桌子上隨機找到一個點,讓機器人的兩指平行爪旋轉一定的角度後直接抓取這個物品。機器人隨後會舉起胳膊、通過力量感測器來明確抓握是否已經成功,這個過程重復188次,每次轉換的角度是10度。

  為了讓機器人更好地學習,平托和敢普塔在巴克斯特的桌子前面放了很多物品,並讓它獨自在那裏一呆就是10個小時,中間不許人類干涉。如果機器人將物品掉落在地板上,桌面上還有很多替代的物品可以供其不間斷地練習。

  巴克斯特的深度學習方法非常標準,研究人員為它裝載了一個常規的神經網路,能夠在學習抓握之前具備一些基本的對象識別技能。然而,仍有兩個網路層面需要用於隨機抓取經驗的學習。

  研究團隊利用第二個學習層面來改進巴克斯特的技能。在選取了一些基本的物品之後,他們提供給巴克斯特一些新的東西,裏面有它見過的,還有對它來説全新的物件。

  超過700個小時後,巴克斯特對150種物品嘗試了5萬次抓取(包括未成功的抓取)。這些物品包括電視遙控器、很多不同的塑膠玩具,還有一些大小類似的物品。這讓巴克斯特可以預測出是否能抓取成功的幾率達到80%。

  像使巴克斯特這樣與世界産生互動的有趣研究將産生重要的影響。關鍵之處是,巴克斯特像人那樣很容易就適應了雜亂的相對沒有規矩的環境。更重要的是,抓握物品的技能基本上是靠自學完成的。

  當然了,巴克斯特和它的神經網路要像嬰兒那樣靈活自如還有很長的路要走。下一步需要學的技能是學習抓握的力度,這樣在拿到脆弱的物品時不至於將之毀於一旦。

  可能最終對巴克斯特的測試會是挑戰牙膏——將豆粒大小的牙膏擠在牙刷上。畢竟,這是人類從小要學會的很重要的一件事情。

  看視頻學會調製雞尾酒

  工業機器人要執行一個複雜的新任務,需要花上數周時間來重新編程,這讓現代製造業生産線的重組變得十分昂貴和緩慢。

  如果機器人能夠在勝任新工作之前看著別人先做一遍,整個進程可能會用“突飛猛進”來形容。這是美國馬利蘭大學執行的一個項目中的“點子”,他們正在教育機器人成為“勤勉的學生”。

  馬利蘭大學自主性、機器人與認知實驗室的楊葉舟(音)説:“我們叫它‘機器人培訓學院’。我們請專家給機器人演示一遍任務,並讓機器人按照任務的流程完成大部分工作,然後微調一下完成任務。”

  在聖路易斯召開的一次相關會議上,研究人員展示了一個能調製雞尾酒的機器人,正是用了上述方法完成了調製任務。這個擁有兩個工業化機械手臂的傢夥來自波士頓一家名為“重新思考機器人”的公司。一個人從幾個瓶子中倒出液體後在一個小壇子裏混合成一杯飲品,機器人觀看了整個過程,複製下所有的動作,關鍵是,它抓起瓶子的順序是正確的。

  這需要訓練一個電腦系統與特殊的機器人動作相適應。該研究團隊最近的一篇論文指出,一個機器人學會選取不同的物品,需要使用兩套不同的系統來觀看數千遍的教學視頻,一個系統是學習如何識別不同的物品,另一個系統是明確不同類型的抓握動作。

  觀看數千遍的教學視頻可能聽起來很費時間,但是學習的過程比重新對機器人編程效率高得多,重要的是,它很容易讓機器人“上手”新任務。用於抓握動作的學習系統包含了先進的人工神經網路,這種技術近幾年取得了快速發展,現在正如火如荼地被用於開發多種類型的機器人。

  研究人員正在向包括電子商務、汽車製造商在內的幾家製造業公司推介它們的學習機器人,看是否能將這個新技術應用於工業生産。這些公司也曾為了拓展機器人工作任務找過工程師重新對機器人編程,但大多數都需要一個半月或者更長的時間才能搞定。楊葉舟説:“用我們的方法至少可以節省一半時間。”

  該項目反映了機器人行業的兩大發展趨勢,一個是找到機器人學習的新方法,另一個是機器人可最大程度地以人類工作的方式進行操作。

  機器人也用學習軟體

  機器人技術的迅速推進,部分原因在於硬體,包括電腦晶片、感測器和執行器的研究進展,但是軟體也同樣推進了技術進步。例如,開源的機器人作業系統讓工程師為機器人增加新的技能變得更容易,這樣就不必要都從零開始。

  小孩子在蹣跚學步的時候能快速識別一頓美味或者避免抓住帶刺的東西,近日發佈的一個軟體能讓機器人通過經驗學習而非編輯程式,也能如此智慧。

  先進的機器學習軟體,比如Brain OS能夠讓機器人看到更先進的技能,也能夠讓機器人學習更為先進的技術經驗。

  Brain OS由一家位於美國聖地亞哥的移動晶片製造商高通公司支援的“大腦公司”開發。這樣的軟體最終讓機器人更容易被使用。使用Brain OS的用戶不需要編寫新的代碼或者訪問圖形用戶界面,就能輕鬆地訓練機器人做一些簡單的任務,比如朝著特定的物體移動。

  對於機器人來説,在複雜的、不斷變換的環境中穩定地工作是非常困難的事情,這就是要將學習能力變成可靠途徑的一個重要原因。一些商業化的機器人已經能夠進行簡單的學習,但是Brain OS套裝軟體含了一系列為機器人學習提供的工具,可以讓機器人工程師更容易進入這個軟體庫,來為機器人獲取諸如對象識別、導航和操作任務的程式。

  去年在波士頓舉辦的機器人會議上,大腦公司展示了這款軟體,當時該公司用一個紅色原型機器人拼裝成一個由兩隻攝像頭做眼睛的賽格威電動平衡車,它把一個對象展示給機器人,然後機器人能夠跟隨物體,不離不棄。

  Brain OS利用的學習能力包括給能模擬神經元和突觸的虛擬網路提供資訊,然後提供正面或者反面的反饋,這個過程被稱為“監督學習”。近年來這種學習方法因非常有效而備受矚目。

  大腦公司的執行副總裁托德·希爾頓在一份聲明中説,機器學習軟體大多數針對學術研究人員而不是工業工程師。“Brain OS通過提供接近原型的、可商業化的機器人應用中央技術框架來解決這個問題”。

  大腦公司還發佈了一個由高通公司開發的被稱為bStem(腦幹的簡稱)的軟體版晶片。該晶片可以用來設計模擬大腦工作的方式,並行存儲和處理數據。這樣的“神經形態”晶片可以被用來高效運作模擬神經網路,高通公司也是希望將這種技術商業化的公司之一。

熱圖一覽

  • 股票名稱 最新價 漲跌幅