> 要聞

大模型促千行百業數智轉型

隨著人工智慧技術的飛速發展,大模型以強大的數字處理能力和深度學習能力,不斷與各領域交叉融合,逐步成為産業創新的關鍵抓手和驅動新質生産力的關鍵引擎。大模型如何改變我們的生活,又如何賦能千行百業?未來的發展又將走向何方?在近日舉辦的2023中國人工智慧産業年會上,與會專家學者對此進行了深入討論。

擁抱更多應用場景

論壇上,北京航空航太大學教授徐邁用一段國産大模型Kimi生成的演講詞開場:大模型與通用人工智慧是一個充滿活力引領未來的領域……大模型讓交互體驗變得更豐富真實,其可以稱之為真正意義上的人工智慧。

作為當下最強勁的人工智慧技術,大模型之“大”,不僅在於其規模化參數眾多,更在於它所蘊含的巨大潛力和廣闊應用場景。除了常見的內容生成外,在自動駕駛、智慧醫療、工業網際網路等眾多領域,大模型都展現了優勢,真正做到了賦能千行百業。

中國工程院院士、同濟大學校長鄭慶華表示,大模型已成為當前人工智慧的巔峰,像過去對蛋白質精確結構的預測可能要幾個月,還要數以千計的人才能完成,如今在大模型分析支援下,僅用幾分鐘就可以生成結果。

月之暗面Kimi、百度文心一言、科大訊飛星火大模型……通用大模型如雨後春筍般涌現,大模型産業的應用落地也進一步提速。科大訊飛副總裁、研究院院長劉聰介紹,作為國産通用大模型的代表,星火大模型在賦能産業方面表現強勁,目前已與奇瑞汽車合作打造了大模型座艙,率先讓國産大模型在智慧座艙領域應用並産生實效。

對特定場景而言,並非所有企業都需要通用大模型的“全能”,而是更需要模型的精度。深信服科技股份有限公司安全GPT業務主管訾然表示,相較于通用大模型,想要更快實現技術商業化運營,讓用戶願意為之買單,垂直大模型在落地上可能更有優勢。

作為常年深耕網路安全領域的從業者,訾然認為,當前的網路攻擊者已經在利用大模型改進他們的攻擊手法,傳統檢測器難以識別,而安全GPT檢測大模型在惡意代碼理解能力、攻防對抗理解能力、安全基礎知識能力等方面都超越通用大模型,且推理成本低,準確性高,便於落地。目前他所在團隊開發的垂直大模型已為130余家企業提供服務。

環境污染治理也成為目前垂直大模型落地的主要領域之一。北京工業大學副校長喬俊飛帶領的團隊在污染防治過程智慧特徵建模、自組織控制和多目標動態優化等方面取得了不少創新成果。喬俊飛表示,過去環境污染防治難以建立解析模型,主要依靠人工決策,而垂直大模型的落地為環境污染治理提供了技術支撐,依託數據就能對污染處理作出更加客觀精準的判斷,實現科學治污、精準治污。

還需淬煉多重能力

在給生産生活帶來巨大變遷的同時,人工智慧大模型在數據、算力和演算法等方面仍面臨挑戰。

一方面,算力是人工智慧大模型的“燃料”。獲得“吳文俊人工智慧最高成就獎”的鵬城實驗室主任、中國工程院院士高文表示,沒有算力就無法做人工智慧。如果想要讓用戶像用電一樣方便地使用算力,就需要解決數據安全和結果傳輸等問題。對此,鵬城實驗室正牽頭推進“中國算力網”研發與建設,由其建設的“鵬城雲腦”在超級算力節點方面産生了很好的效果,為後續國産算力生態建設發揮了重要作用。

另一方面,高價值數據為大模型提供了持續不斷的“原材料”。模型參數規模越大,對數據的規模和品質要求也就越高。鄭慶華表示,高價值數據就如同礦産資源並非取之不盡、用之不竭。有專家預測到2026年大規模語料可挖掘價值將基本消耗殆盡,在大數據上再訓練出有價值數據的難度較大。另外,目前中文語料庫所佔比例不高,有數據顯示在ChatGPT訓練數據中,中文語料比重不足千分之一。

與此同時,大模型的災難性遺忘也引發業界廣泛關注。災難性遺忘是指在新任務上訓練會損害之前任務的性能。在問題求解階段,無法記住處理過的數據或場景。例如,在無人駕駛中,人對道路情況有記憶,但自動駕駛無法記憶,每次都要重新計算,因此消耗了大量算力和電力。

如何更好推動人工智慧大模型技術由弱到強?鄭慶華建議,可以從3條技術路線入手,一是依託大數據、大算力和強演算法來推動大模型發展,也就是在原本技術路線上做延長工作;二是用“神經+符號”協同的方式,將神經網路強大的學習性、普適性與符號推理的可解釋性、可組合性進行結合;三是人腦記憶啟發的機器記憶智慧模型,此舉有望破解當前大模型存在的一些固有缺陷。

積極探尋發展路徑

談到大模型未來的發展趨勢,不少專家都提到與具身智慧的結合,而人形機器人便是最好的載體之一。到底大模型跟機器人是什麼關係呢?

劉聰舉了這樣一個例子:想要去抽屜裏拿一包薯片放在桌子上,大模型會基於對這件事情的理解做出規劃,即打開抽屜、拿出薯片,再把抽屜關上,這更像是一種離身智慧。但如果和具身智慧結合,就會將剛才這個指令分解,並將每個指令對應結合,通過控制機器人來實現行動。

西北工業大學光電與智慧研究院研究員趙健表示,當前人工智慧模型正在不斷拓展到多模態領域,而具身智慧與多模態大模型相結合,可以實現更高層次的感知、理解和決策,使人工智慧有效應對現實世界中存在的各種複雜情境,為多個領域帶來廣闊的應用前景,成為連接AI和實際生活的橋梁和紐帶。

今年的《政府工作報告》提出,深化大數據、人工智慧等研發應用,開展“人工智慧+”行動,打造具有國際競爭力的數字産業集群。

針對“人工智慧+”行動,鄭慶華認為,從學科體系的建設和人才培養來説,不光要講理念和方法,更重要的是付出實際行動。一是要提出明確的舉措,將人工智慧賦能作為推動創新發展、實現新質生産力的重要手段。通過改造傳統的培養方案課程體系,讓人工智慧技術成為一種基本能力。二是改造傳統實驗平臺和實驗方式,能夠真正動手去研究演算法,體驗人工智慧從設計、開發到應用的全過程。

從行業發展的角度看,訾然表示,各行各業的從業者應該盡可能多地去學習和擁抱大模型,探尋發展路徑,讓大模型更好賦能千行百業發展。

鄭慶華表示,大模型在走向認知智慧的過程中,很多理論和技術問題依然有待突破。未來通過不斷的研究,希望能研製出一種新的基於人腦記憶啟發的機器模型,最終突破大模型的能力上限,實現自立自強,也為我們打造自主智慧財産權的人工智慧底座和模型作出新的貢獻。 (記者 李思雨)

來源:經濟日報  責任編輯:石進玉

(原標題:大模型促千行百業數智轉型)