超級大腦!AI大模型有望重塑資訊産業格局

發佈時間：2022-01-06 10:53:20 | 來源：經濟參考報 | 作者：烏夢達趙旭 | 責任編輯：徐麗麗

《經濟參考報》記者近日調研獲悉，AI（人工智慧）大模型相當於“超級大腦”，正成為人工智慧“新高地”。AI大模型有望實現人工智慧從感知到認知的躍遷，重新定義人工智慧産業模式和産業標準，給部分産業帶來重大變革。我國有較大的AI大模型應用市場，但發展過程中面臨部分技術薄弱、人才稀缺、成本高昂等多重挑戰，亟須對相關技術研發和産業佈局加以引導和支援。

“學富五車”的“超級大腦”

——“不開心的話可以聽點開心的歌，看看喜劇，也可以去運動，或者好好休息一下。”

——“心情不好是一種很正常的情緒，所以不用太過自責。”

針對“今天心情不好應該怎麼辦”這一問題，一個人工智慧平臺以不同的“人設”，給出了不同的回答。通過網址連結進入該平臺，在“人設問答”區隨機輸入問題，機器可支援和扮演不同“人設”，對問題給出多角度答案。該平臺正是基於AI大模型打造而成。

創新工場首席科學家、北京瀾舟科技創始人周明介紹，AI大模型也稱人工智慧預訓練模型，將海量數據導入具有幾億量級甚至十萬億量級參數的模型中，機器通過做類似“完形填空”等任務，深度學習數據中蘊含的特徵、結構，最終被訓練成具有邏輯推理和分析能力的人工智慧。

通俗地説，AI大模型相當於做了無數套關於各領域知識練習題、模擬題的“超級大腦”，深諳各領域知識內在邏輯和解題思路，既能理解人類世界的知識體系，也可能産出新的知識。

2018年起，人工智慧進入“大模型時代”，由重復開發、手工作坊式人工智慧，即“一千個應用場景就有一千個小模型”的零散、低效局面，走向工業化、整合化智慧的全新路徑，以一個大模型“走天下”，為通用人工智慧帶來曙光。比如，為生産智慧音響，各個品牌競相開發各自的AI小模型，未來各品牌只需在同一個AI大模型基礎上開發即可。

“以前是‘碎片化’的人工智慧，針對不同的應用場景要開發不同的模型。作坊式開發對資源、成本造成較大消耗，且效率低下。未來在各垂直領域落地時，只需基於一個大模型，對其參數進行微調即可，這樣就打造出了具有通用性質的人工智慧。”華為雲人工智慧領域首席科學家、國際歐亞科學院院士田奇介紹，AI大模型將重新定義人工智慧産業模式、産業標準，甚至産業倫理。

受訪者舉例介紹，以前的小模型就像“偏科的機器”，只學習針對特定應用場景的有限數據，“舉一反三”能力不足，一些智慧産品被用戶調侃為“人工智障”的情況時有發生。而AI大模型則學習了各行各業各類數據，成為具備良好的知識遷移能力的“通才”，適用領域更廣，産出內容品質更高，更加智慧。

同時，周明指出，大模型的發展並非一味追求參數量大，而是聚焦模型的高性能，“在讓大模型學習和掌握更大量數據的同時，盡可能讓大模型參數相對輕量化，在‘減負’的同時提高能效。”

可分飾多角應用場景廣泛

自動問診、産品行銷、小説續寫……由於懂得人類語言，且具備細分行業專業知識，一個AI大模型可分飾多角，它做得了醫生，當得了作家，勝任得了情感博主，從事得了電商客服……

AI大模型行業適用範圍廣，在醫療、金融、零售、氣象、新聞傳播、文學藝術等領域具有廣泛應用場景。周明介紹，在大模型中輸入關鍵詞、主題、文本風格等控制屬性後，即可生成滿足約束條件的文本內容，可用於産品行銷文案寫作、電商智慧客服等。在金融等領域，大模型通過抓取行業數據，自主完成篩選、分析，並自主撰寫生成行業報告，輔助從業人員做決策。

田奇介紹，AI大模型已應用於國網電力部門的日常線路檢測。“以前要識別各種電力傳輸線上的缺陷，需要針對每一類缺陷單獨做一個小模型，有幾百種缺陷就要做幾百種模型，現在利用一個大模型就可完成各類缺陷的識別。”

值得注意的是，AI大模型目前的技術進步，是人工智慧從感知向認知演進的關鍵環節。清華大學電腦科學與技術係副教授劉知遠表示，古今中外一切文章、資料，都可作為訓練大模型的數據。通過分析並“內化”海量知識，不僅讓智慧産品擁有更高性能，如機器翻譯更加準確、機器寫作更加生動有邏輯；還能品讀人類情感，用於情感標注。此外，“它可能識別到‘弦外之音’，甚至有希望發現人類未曾掌握的知識。”

這一技術的發展，也可能給部分産業帶來重大變革。周明説，未來將産生新一代搜索引擎。“目前大部分搜索引擎是基於關鍵詞識別，只將庫裏已有的包含關鍵詞的結果‘搬運’給用戶，而基於大模型的新一代搜索引擎，通過理解人類語言，可以自主生成回答，且支援文字、圖片、音頻、視頻等多模態搜索。”

田奇表示，新一代搜索引擎具備創作能力，比如搜索“長翅膀的貓”“會飛的豬”等現實中不存在的事物，搜索引擎也可根據描述生成相應照片。

多重發展難題待解

當前，美國OpenAI、谷歌、微軟、臉書、英偉達等海外公司紛紛佈局AI大模型産業，國內的華為、阿里巴巴、百度等大型企業，以及高校、科研機構也加入研發賽道。AI大模型正成為人工智慧“新高地”。

記者調研了解到，從技術上講，國內AI大模型已初步成熟，下一步將聚焦行業推廣，並結合具體問題對模型進行迭代。田奇預測，AI大模型的大規模應用“可能還需要兩到三年時間”，且未來AI大模型還有望集納于晶片上，更方便落地應用。

專家指出，我國有較大的AI大模型應用市場，在應用領域具有優勢，但發展過程中也面臨一些挑戰。

劉知遠介紹，很多核心技術目前仍然掌握在發達國家手中，訓練AI大模型需大量GPU（圖形處理器）晶片，但當前國産GPU晶片技術相對薄弱。同時，我國在演算法上的原始創新能力也有待提升。

多位受訪者表示，目前從事AI大模型研發且能産出創新性成果的高校、科研機構和企業屈指可數，與國外相比，我國相關領域高水準基礎人才培養力度有待加強。

此外，訓練大模型需要較高的電力成本、設備成本等，很多中小企業、科研單位囿于高昂成本，無法搭建擁有充足算力的機房，面臨算力不足的問題。

多措並舉搶佔“新高地”

多位專家表示，AI大模型有望實現人工智慧從感知到認知的躍遷，將更高效地賦能AI産業化和産業AI化。相關技術研發和産業佈局引導、配套支援政策、合理監管等舉措能否有效落地至關重要。

首先，推進AI大模型標準化。受訪專家指出，大模型的訓練過程具有高能耗的特點，制定標準後，許多工作可基於已經開發的標準化大模型進行適配和二次開發，無需每次從頭訓練，以降低能耗。同時，大模型發展的過程中，也可能衍生違法違規資訊生成、隱私洩露、虛假資訊傳播等風險，對用於訓練模型的源頭數據等做好規範，有利於規避相關風險。國家相關部門可牽頭或引導企業、研究所、高校等共同定義大模型的標準。

其次，適當開放訓練數據。受訪者表示，訓練大模型需要海量數據，出於對數據的隱私、安全等方面的擔憂，一些領域難以獲取數據，形成數據孤島。建議在國家機構監管和宏觀把控的前提下，各方數據能夠對白名單企業、機構、高校適當開放，在確保數據安全使用的同時，增強我國AI大模型實力。例如，醫院等機構適當開放數據，將有利於訓練更懂醫療的大模型，賦能健康醫藥領域發展。

再次，鼓勵算力共用。記者調研了解到，目前只有部分大企業能夠負擔超大模型訓練所需的算力成本。受訪專家呼籲，可引導具有強算力的人工智慧“國家隊”，為更多中小微企業、科研單位提供大模型訓練所需的算力支撐，可探索合理付費的算力共用機制，共同促進技術的發展和資源的節約。

最後，加大原始創新引導和支援。多位專家指出，我國應加強研發力度，同時加強針對模型框架的基礎創新研究，引導更多科研單位、高校積極培養相關人才，鼓勵更多社會力量加入這場資訊革命的浪潮。（記者烏夢達趙旭）

[列印] [收藏] [發表評論]

分享到: