美國IBM研究院實現深度學習性能突破
發佈時間:2017-09-19 16:27:21 | 來源:中國網 | 作者:胡俊 | 責任編輯:胡俊中國網9月19日訊 據科技部消息,美國IBM研究院近日宣佈,通過全新的分佈式深度學習軟體,實現了接近理想的擴展能力,該軟體在64台IBM Power系統伺服器中的256個GPU上並行運作深度學習框架,實現了95%的擴展效率,並使運算速度與準確率得到了顯著提升。此前最佳的系統擴展能力是Facebook人工智慧研究院所取得的89%。
深度學習是一種廣泛使用的人工智慧方法,可以幫助電腦通過大量數據理解真實世界的圖像和聲音,並提取其中的含義。到目前為止,深度學習主要是在單一伺服器上運作的,在不同電腦之間高速移動大量數據的協調過程太過複雜,因此大規模運作深度學習模型在技術上面臨著困難,訓練時間通常要持續數天甚至數周。
IBM研究團隊編寫了軟體和演算法,能夠對在數十台伺服器中的數百個GPU加速器間並行運作非常龐大且複雜的計算任務和自動優化。在使用ImageNet-22k數據集的750萬張圖像訓練模型時,圖像識別準確率史無前例地達到了33.8%,而微軟此前發佈的最好結果為29.8%。IBM的分佈式深度學習技術不僅提高了準確率,還能大幅縮短運算時間,可在7小時內訓練一個ResNet-101神經網路模型,而微軟訓練同一個模型需要花費10天時間。