技術創新快 應用滲透強 國際競爭激烈 千行百業加速擁抱大模型(AI前沿觀察)
近日,《聯合國氣候變化框架公約》第二十八次締約方大會(COP28)在阿聯酋迪拜舉行。大會期間,中國研究團隊展示的人工智慧氣候大模型引發廣泛關注。此款名為“伏羲”的大模型,對氣象進行預報的時間範圍長、精度高。
當前,中國國産大模型進入高速發展期,千行百業加速擁抱大模型。科技部新一代人工智慧發展研究中心發佈的《中國人工智慧大模型地圖研究報告》顯示,中國研發的大模型數量排名全球第二,涌現出一批具有行業影響力的預訓練大模型。
工業和資訊化部新聞發言人陶青表示:“以大模型為代表的人工智慧發展呈現出技術創新快、應用滲透強、國際競爭激烈等特點,深刻改變製造業生産模式和經濟形態,展現出強大的賦能效應。”
垂直大模型密集“上新”
專家認為,大模型的長期價值將通過行業應用實現。隨著技術不斷迭代更新,大模型的應用場景日益廣泛。
在北京經濟技術開發區(北京亦莊),不少駕車的市民發現,遇到紅燈的次數明顯變少了,經常是“一路綠燈”。這背後,是全域信控與交通大模型在發揮作用。
據了解,北京亦莊聯手百度,將路側感知數據、網際網路數據等多源時空數據進行融合。在此基礎上,利用交通大模型研判擁堵發生的可能性,疊加倣真推演,生成全域信控方案,並自動優化信號燈配時方案,由“車看燈行”變為“燈隨車動”。據測算,北京亦莊佈局全域信控後,路口的平均通過時間縮短28%。
從交通到文旅,從教育到醫療,近期,垂直領域的各類大模型密集“上新”。相較于通用大模型,垂直大模型具有更強的專業性,能夠更好地解決特定領域的問題和提供更加精準的服務。
攜程集團發佈的旅遊行業垂直大模型“攜程問道”,支援自然語言交互,可以輔助用戶進行酒店、景點預定以及行程規劃決策等。
科大訊飛發佈的“訊飛曉醫”APP,基於訊飛星火醫療大模型,可實現健康自查、體檢報告解讀、健康檔案管理等功能,為用戶提供健康諮詢。
南京農業大學科研團隊發佈的古籍大語言模型,能夠實現詞法分析、資訊抽取、智慧作詩等功能,有望應用推廣到古籍整理、數字文娛等領域。
數據顯示,截至今年10月,中國擁有10億參數規模以上大模型的廠商及高校院所超過250家,垂直行業應用成為大模型産業落地的關鍵賽道。上海財經大學校長劉元春認為,中國作為世界第二大經濟體,擁有超大規模市場和數字資源優勢,為大模型提供了更深入、更豐富的落地場景以及能夠持續訓練的環境。
“當前,大模型‘基礎設施—底層技術—基礎通用—垂直應用’的發展路線逐漸清晰。”中國工程院院士、湘江實驗室主任陳曉紅表示,大模型技術與實體經濟加速融合,應用場景十分廣泛。
數據“燃料”加快共建共用
數據是大模型訓練的“燃料”,數據品質對大模型至關重要。國內大模型快速發展對高品質數據的迫切需求,推動中文語料數據資源加快共建共用。
今年7月,2023世界人工智慧大會發起成立了中國大模型語料數據聯盟。8月,上海人工智慧實驗室宣佈,聯合中國大模型語料數據聯盟成員單位共同開源發佈“書生·萬卷”1.0多模態預訓練語料。本次開源的數據總量超過2TB,包含超5億個文本、2200萬個圖文交錯文檔、1000個影像視頻。
在11月舉行的2023人工智慧計算大會上,智源研究院聯合阿裏雲、中科創達、螞蟻集團等17家企業發佈《“中文網際網路語料庫”共建共用倡議書》。
數據交易日益興起,為大模型獲取語料資源提供了新途徑。《上海市推動人工智慧大模型創新發展若干措施(2023—2025年)》提出:“依託上海數據交易所建立語料數據交易板塊。”當前,上海數據交易所掛牌的語料數據産品包含文本、音頻、圖像等多模態,覆蓋金融、交通、醫療等領域。上海數據交易所總經理湯奇峰表示:“語料庫採購已經在不少大模型企業成本中佔據重要比重,上海數交所希望以市場配置的方式組織數據要素、推動語料庫建設。”
建設智算中心增加算力供給
大模型進行訓練和推理時,對算力的需求量巨大。算力是大模型的底座。算力通常分為通用算力、智慧算力和超算算力,大模型需要的是智慧算力。如何破解智慧算力緊缺問題,成為大模型發展路上的必答題。
電信運營商、網際網路企業等積極投入智算中心建設之中。去年至今,重慶移動智算中心、阿裏雲張北超級智算中心等陸續投入運營。今年以來,中國聯通長三角(蕪湖)智算中心、河北石家莊智算中心等相繼啟動建設。
當前,各地加速推動算力基礎設施建設,提升算力供給能力。《北京市促進通用人工智慧創新發展的若干措施》提出,加快推動海澱區、朝陽區建設北京人工智慧公共算力中心、北京數字經濟算力中心,形成規模化先進算力供給能力,支撐千億級參數量的大型語言模型、大型視覺模型、多模態大模型、科學計算大模型、大規模精細神經網路模擬倣真模型、腦啟發神經網路等研發。《河南省重大新型基礎設施建設提速行動方案(2023—2025年)》提出,實施高性能算力提升工程,加快建設鄭州、洛陽等全棧國産化智慧計算中心,構建中原智慧算力網。
在“東數西算”戰略背景下,西部智算中心建設迎來發展機遇期。11月30日,青藏高原第一座智算中心——青海崑崙人工智慧算力中心正式揭牌,依託三江源國家大數據基地,實現算力資源的託管運營。12月7日,寧夏回族自治區首個大規模集群智算中心建設項目簽約,該中心以國産全功能GPU為底座,為大模型訓練與推理、3D圖形渲染等提供算力支撐。
今年10月,工業和資訊化部等6部門印發《算力基礎設施高品質發展行動計劃》,提出到2025年,算力規模超過300EFLOPS(EFLOPS是指每秒百億億次浮點運算次數),智慧算力佔比達到35%。京津冀、長三角、粵港澳大灣區、成渝等節點面向重大區域發展戰略實施需要,有序建設算力設施;貴州、內蒙古、甘肅、寧夏等節點推進數據中心集群建設的同時,著力提升算力設施利用效率,促進東西部高效互補和協同聯動。
“算力尤其是智慧算力已經成為驅動大模型進化的核心引擎。智算力就是創新力,已經成為産業共識。”浪潮資訊董事長彭震表示,應大力發展普適普惠的智算中心,使智慧算力成為城市的公共基礎資源,用戶可以選擇自建算力集群,也可以採用智算中心提供的算力服務來完成大模型開發。
來源:人民日報海外版 責任編輯:石進玉
(原標題:技術創新快 應用滲透強 國際競爭激烈 千行百業加速擁抱大模型(AI前沿觀察))