近日,知名人工智慧學者吳恩達發表文章,闡述了他對於人工智慧在傳統行業中應用緩慢的理解。無論是刷短視頻時的個性化推薦,還是外賣配送時的耗時預估,或者是移動支付時的人臉識別,以演算法為代表的AI技術在消費網際網路行業被應用得“得心應手”。然而提到傳統行業,人們卻很難快速想起非常成熟的應用人工智慧的典型案例。為何AI技術在傳統行業的應用速度和範圍遠不如消費網際網路等行業?

消費網際網路行業應用AI更具優勢

“AI技術的應用主要取決於數據、算力和演算法。”天津大學智慧與計算學部副教授朱鵬飛介紹,首先數據要達到一定的體量,這是應用的基礎,此外算力也要能支援大規模的模型訓練,而後演算法方面需要達到一定的精度,端側算力也要具備一定的推理能力。

之所以目前只有消費網際網路公司在大規模應用AI技術,主要是在這三方面消費網際網路公司都更具優勢。

前些年短視頻並沒有現在這麼火爆,例如發展初期的淘寶,也並沒有很強的用戶黏性。而隨著推送越來越精準,用戶的體驗感也得到了極大的提升,最終呈現井噴式的用戶增長。

“精準推送主要依賴於演算法精度的提升,而演算法精度的提升又離不開海量的數據作為基礎。”朱鵬飛解釋,在這個單一的場景中,演算法模型需要不斷進化,終身學習。由於不是封閉數據環境,總有新的數據加入,演算法模型需要不斷通過學習進行調整、迭代升級,使其精度越來越高,形成一個良性迴圈。

“與此同時,雖然目前消費網際網路行業在演算法精度上已經上升到一定的高度,但相比一些傳統行業的應用場景,消費網際網路行業對於AI演算法精度接受的閾值都比較低。比如短視頻、淘寶偏好推薦、百度熱搜關鍵詞,只需要達到用戶産生黏性的目的,只要有一定準確性,用戶都可以接受。”朱鵬飛表示,相比之下,在很多傳統行業,對於技術精度的要求就高得多。比如基於視覺的AI技術在人臉識別方面的應用,在高鐵站、飛機場核實身份,1:1的比對準確度要高達99.99%甚至更高才可以進行應用。

在算力方面,目前雲端算力已經可以支援大規模模型訓練和推理,比如短視頻、淘寶推薦等。但在大量傳統行業應用場景中,智慧終端上的端側算力還無法滿足推理的實時性和準確性要求。

“相比于社交網路和電商系統,傳統行業應用場景的封閉生態系統使得雲端算力無法得到有效應用。”朱鵬飛舉例説,以智慧無人系統巡檢為例,電力巡檢、管道巡檢、交通巡檢、河道巡檢以及光伏巡檢等要求搭載在無人機和機器人上的算力滿足實時巡檢要求,由於視頻分析的模型複雜度較高,端側往往無法實現精準高效的實時推理,輕量級網路在滿足實時性的同時損失了識別精度。由於演算法精度達不到使用要求,使得在很多場景中無法實現AI技術的應用。

傳統行業應用AI面臨三大挑戰

吳恩達認為,在AI應用方面,消費網際網路行業之外的其他行業都面臨著三大挑戰:數據集很小;定制化成本很高;從驗證想法到部署生産的過程很長。

對此,朱鵬飛也深有感觸,他以傳統製造業為例進行了分析。

“傳統製造企業在製造向智造轉型的過程中,數據是一個很突出的問題。”朱鵬飛介紹,首先在數據的獲取方面存在一定難度。傳統製造企業的數據是封閉的,因為很多傳統企業並不是新型資訊化設備,沒有感測器收集實時數據,也沒有數據中心,因此數據零散,缺失嚴重,很難獲取像消費網際網路企業裏那種海量、高品質的數據。

其次,行業內部各個工廠的數據很多具有商業價值,因此工廠都嚴格保密,這導致數據不流通,沒有辦法進行共用,進而形成了數據孤島效應,影響了AI演算法模型的優化。

“我們在開發一個AI演算法模型的時候,因為數據的保密性,往往得到的數據都是經過‘脫敏’的,這也嚴重地影響了我們的判斷。而傳統行業的企業中,又缺乏具有AI演算法模型開發能力的技術人員,因此雙方在合作研發過程中也存在著很高的壁壘。”朱鵬飛説。

此外,傳統行業中的數據來源並不像消費網際網路領域那樣來自單一場景,複雜的業務場景導致數據往往很“臟”,必須進行“清洗”,去掉大量無效資訊,AI演算法模型才能高效率的學習以提高精度。“這就像我們教小朋友知識,只講知識點,小朋友們才能學得快,如果在知識點中夾雜著大量無用的資訊,小朋友無從分辨,學習效率肯定降低。”朱鵬飛介紹,而給數據標注“知識點”的工作是巨大而繁瑣的,需要企業有專人去做,要花費很多時間精力。

“傳統製造業要想獲得高品質的數據,就必須對生産設備進行資訊化、智慧化的改造。”朱鵬飛表示,這種改造需要企業投入大量的時間和精力,還會增加生産成本,這也成為AI在傳統製造業中應用的壁壘。

高品質數據是應用前提

過去這10年,大部分AI的研發和應用是“以軟體為中心”驅動的。在海量數據的支撐下,不斷優化軟體和演算法,來獲得更高的演算法精度。在傳統行業無法提高數據品質和數量的情況下,吳恩達認為,傳統行業應該採用“以數據為中心”的模式,把重點放在獲得品質更好、匹配度更高的數據上。

“在這種思路下,傳統行業也涌現了一些不錯的應用案例。比如醫學領域的影像識別AI系統,可以幫醫生‘看’CT影像片子,對腫瘤等病變加以識別,輔助醫生做出判斷。”朱鵬飛介紹,由於很多數據都由專業的放射科醫生在影像片子上進行了標注,因此數據比較準確,AI演算法模型在學習的過程中進步很快。目前很多影像識別系統的準確率都能達到90%以上,由於是輔助醫生,最後還需醫生做醫療決策,但這個水準的準確率在很大程度上降低了醫生的工作強度。

“儘管傳統行業有了一些應用AI技術的成功案例,但是要想更好地和AI結合,還得在提高數據品質方面下功夫。”朱鵬飛建議,首先對於已經積累了海量數據的傳統行業,在保證數據安全的前提下,主動開放數據。挖掘數據中蘊藏的價值,和需求關聯起來,會有很大的發展空間。其次,對於新興行業,比如新能源汽車等,在構建智慧工廠規劃的時候,就把獲取數據、智慧化的因素考慮進去。

不過朱鵬飛強調,在傳統行業用好AI技術的同時,也不要濫用AI技術,在應用前做好評估,如果不能提高生産效率,對行業整體有所提升,那麼盲目強行使用AI技術,就是對資源的浪費。“比如一些應用場景需要AI演算法達到99%以上的精度才可以使用,通過評估,現有模型演算法只能達到90%的精度,那麼這個場景就沒必要強行開工AI技術了。”

“總而言之,對於AI技術的應用要數據先行,有高品質的數據再談應用,沒有好的數據很難有好的應用。”朱鵬飛説。

責任編輯:白雨