您的位置: 技術市場>人工智慧>

超級大腦!AI大模型有望重塑資訊産業格局

發佈時間:2022-01-06 10:53:20  |  來源:經濟參考報  |  作者:烏夢達 趙旭  |  責任編輯:徐麗麗

《經濟參考報》記者近日調研獲悉,AI(人工智慧)大模型相當於“超級大腦”,正成為人工智慧“新高地”。AI大模型有望實現人工智慧從感知到認知的躍遷,重新定義人工智慧産業模式和産業標準,給部分産業帶來重大變革。我國有較大的AI大模型應用市場,但發展過程中面臨部分技術薄弱、人才稀缺、成本高昂等多重挑戰,亟須對相關技術研發和産業佈局加以引導和支援。


“學富五車”的“超級大腦”


——“不開心的話可以聽點開心的歌,看看喜劇,也可以去運動,或者好好休息一下。”


——“心情不好是一種很正常的情緒,所以不用太過自責。”


針對“今天心情不好應該怎麼辦”這一問題,一個人工智慧平臺以不同的“人設”,給出了不同的回答。通過網址連結進入該平臺,在“人設問答”區隨機輸入問題,機器可支援和扮演不同“人設”,對問題給出多角度答案。該平臺正是基於AI大模型打造而成。


創新工場首席科學家、北京瀾舟科技創始人周明介紹,AI大模型也稱人工智慧預訓練模型,將海量數據導入具有幾億量級甚至十萬億量級參數的模型中,機器通過做類似“完形填空”等任務,深度學習數據中蘊含的特徵、結構,最終被訓練成具有邏輯推理和分析能力的人工智慧。


通俗地説,AI大模型相當於做了無數套關於各領域知識練習題、模擬題的“超級大腦”,深諳各領域知識內在邏輯和解題思路,既能理解人類世界的知識體系,也可能産出新的知識。


2018年起,人工智慧進入“大模型時代”,由重復開發、手工作坊式人工智慧,即“一千個應用場景就有一千個小模型”的零散、低效局面,走向工業化、整合化智慧的全新路徑,以一個大模型“走天下”,為通用人工智慧帶來曙光。比如,為生産智慧音響,各個品牌競相開發各自的AI小模型,未來各品牌只需在同一個AI大模型基礎上開發即可。


“以前是‘碎片化’的人工智慧,針對不同的應用場景要開發不同的模型。作坊式開發對資源、成本造成較大消耗,且效率低下。未來在各垂直領域落地時,只需基於一個大模型,對其參數進行微調即可,這樣就打造出了具有通用性質的人工智慧。”華為雲人工智慧領域首席科學家、國際歐亞科學院院士田奇介紹,AI大模型將重新定義人工智慧産業模式、産業標準,甚至産業倫理。


受訪者舉例介紹,以前的小模型就像“偏科的機器”,只學習針對特定應用場景的有限數據,“舉一反三”能力不足,一些智慧産品被用戶調侃為“人工智障”的情況時有發生。而AI大模型則學習了各行各業各類數據,成為具備良好的知識遷移能力的“通才”,適用領域更廣,産出內容品質更高,更加智慧。


同時,周明指出,大模型的發展並非一味追求參數量大,而是聚焦模型的高性能,“在讓大模型學習和掌握更大量數據的同時,盡可能讓大模型參數相對輕量化,在‘減負’的同時提高能效。”


可分飾多角 應用場景廣泛


自動問診、産品行銷、小説續寫……由於懂得人類語言,且具備細分行業專業知識,一個AI大模型可分飾多角,它做得了醫生,當得了作家,勝任得了情感博主,從事得了電商客服……


AI大模型行業適用範圍廣,在醫療、金融、零售、氣象、新聞傳播、文學藝術等領域具有廣泛應用場景。周明介紹,在大模型中輸入關鍵詞、主題、文本風格等控制屬性後,即可生成滿足約束條件的文本內容,可用於産品行銷文案寫作、電商智慧客服等。在金融等領域,大模型通過抓取行業數據,自主完成篩選、分析,並自主撰寫生成行業報告,輔助從業人員做決策。


田奇介紹,AI大模型已應用於國網電力部門的日常線路檢測。“以前要識別各種電力傳輸線上的缺陷,需要針對每一類缺陷單獨做一個小模型,有幾百種缺陷就要做幾百種模型,現在利用一個大模型就可完成各類缺陷的識別。”


值得注意的是,AI大模型目前的技術進步,是人工智慧從感知向認知演進的關鍵環節。清華大學電腦科學與技術係副教授劉知遠表示,古今中外一切文章、資料,都可作為訓練大模型的數據。通過分析並“內化”海量知識,不僅讓智慧産品擁有更高性能,如機器翻譯更加準確、機器寫作更加生動有邏輯;還能品讀人類情感,用於情感標注。此外,“它可能識別到‘弦外之音’,甚至有希望發現人類未曾掌握的知識。”


這一技術的發展,也可能給部分産業帶來重大變革。周明説,未來將産生新一代搜索引擎。“目前大部分搜索引擎是基於關鍵詞識別,只將庫裏已有的包含關鍵詞的結果‘搬運’給用戶,而基於大模型的新一代搜索引擎,通過理解人類語言,可以自主生成回答,且支援文字、圖片、音頻、視頻等多模態搜索。”


田奇表示,新一代搜索引擎具備創作能力,比如搜索“長翅膀的貓”“會飛的豬”等現實中不存在的事物,搜索引擎也可根據描述生成相應照片。


多重發展難題待解


當前,美國OpenAI、谷歌、微軟、臉書、英偉達等海外公司紛紛佈局AI大模型産業,國內的華為、阿里巴巴、百度等大型企業,以及高校、科研機構也加入研發賽道。AI大模型正成為人工智慧“新高地”。


記者調研了解到,從技術上講,國內AI大模型已初步成熟,下一步將聚焦行業推廣,並結合具體問題對模型進行迭代。田奇預測,AI大模型的大規模應用“可能還需要兩到三年時間”,且未來AI大模型還有望集納于晶片上,更方便落地應用。


專家指出,我國有較大的AI大模型應用市場,在應用領域具有優勢,但發展過程中也面臨一些挑戰。


劉知遠介紹,很多核心技術目前仍然掌握在發達國家手中,訓練AI大模型需大量GPU(圖形處理器)晶片,但當前國産GPU晶片技術相對薄弱。同時,我國在演算法上的原始創新能力也有待提升。


多位受訪者表示,目前從事AI大模型研發且能産出創新性成果的高校、科研機構和企業屈指可數,與國外相比,我國相關領域高水準基礎人才培養力度有待加強。


此外,訓練大模型需要較高的電力成本、設備成本等,很多中小企業、科研單位囿于高昂成本,無法搭建擁有充足算力的機房,面臨算力不足的問題。


多措並舉搶佔“新高地”


多位專家表示,AI大模型有望實現人工智慧從感知到認知的躍遷,將更高效地賦能AI産業化和産業AI化。相關技術研發和産業佈局引導、配套支援政策、合理監管等舉措能否有效落地至關重要。


首先,推進AI大模型標準化。受訪專家指出,大模型的訓練過程具有高能耗的特點,制定標準後,許多工作可基於已經開發的標準化大模型進行適配和二次開發,無需每次從頭訓練,以降低能耗。同時,大模型發展的過程中,也可能衍生違法違規資訊生成、隱私洩露、虛假資訊傳播等風險,對用於訓練模型的源頭數據等做好規範,有利於規避相關風險。國家相關部門可牽頭或引導企業、研究所、高校等共同定義大模型的標準。


其次,適當開放訓練數據。受訪者表示,訓練大模型需要海量數據,出於對數據的隱私、安全等方面的擔憂,一些領域難以獲取數據,形成數據孤島。建議在國家機構監管和宏觀把控的前提下,各方數據能夠對白名單企業、機構、高校適當開放,在確保數據安全使用的同時,增強我國AI大模型實力。例如,醫院等機構適當開放數據,將有利於訓練更懂醫療的大模型,賦能健康醫藥領域發展。


再次,鼓勵算力共用。記者調研了解到,目前只有部分大企業能夠負擔超大模型訓練所需的算力成本。受訪專家呼籲,可引導具有強算力的人工智慧“國家隊”,為更多中小微企業、科研單位提供大模型訓練所需的算力支撐,可探索合理付費的算力共用機制,共同促進技術的發展和資源的節約。


最後,加大原始創新引導和支援。多位專家指出,我國應加強研發力度,同時加強針對模型框架的基礎創新研究,引導更多科研單位、高校積極培養相關人才,鼓勵更多社會力量加入這場資訊革命的浪潮。(記者 烏夢達 趙旭 )


 
分享到:
0