美國科學家在最新一期《自然》雜誌發表論文稱,他們開發了首塊可擴展的基於深度神經網路的光子晶片,每秒可對20億張圖像進行直接分類,而無需時鐘、感測器或大記憶體模組,有望促進人臉識別、自動駕駛等領域的發展。
模倣人腦工作的深度神經網路現在通常為電腦視覺、語音識別等提供支援。目前數字晶片上的消費級圖像分類技術每秒可執行數十億次計算,速度足以滿足大多數應用,但更複雜的圖像,如識別運動物體、3D物體或人體顯微細胞分類仍面臨不少障礙。
首先,這些系統通常使用基於數字時鐘的平臺,如圖形處理單元(GPU)來實現,這將它們的計算速度限制在時鐘頻率上,計算必須逐個進行。其次,傳統電子設備將記憶體和處理單元分開,數據穿梭耗費時間。此外,原始圖像數據通常需要轉換為數字電子信號,耗時較長,而且需要大記憶體單元來存儲圖像和視頻,引發潛在的隱私問題。
鋻於此,賓夕法尼亞大學電氣和系統工程副教授弗瑞茲·阿發雷托尼等人開發出一款可擴展晶片,每秒可對近20億張圖像進行分類。這是第一個完全在整合光子設備上以可擴展方式實現的深度神經網路,整個晶片大小只有9.3平方毫米,消除了傳統電腦晶片中的4個主要耗時障礙:光信號到電信號的轉換、將輸入數據轉換為二進位格式、大存儲模組以及基於時鐘的計算。
阿發雷托尼解釋説,該晶片上的光學神經元通過光線相互連接,形成一個由許多“神經元層”組成的深層網路。資訊通過“神經元層”傳遞,每一步都對圖像分類,使快速處理資訊成為可能,最新晶片可在半納秒內完成整個圖像分類,而傳統數字電腦晶片在同樣時間內只能完成一個計算步驟。
研究人員表示,可通過添加更多神經層來擴展這一深層網路,使晶片能以更高解析度讀取更複雜圖像中的數據。此外,任何可轉換為光的信號,如音頻和語音,都可使用這項技術幾乎瞬間進行分類。