> 指數

源頭創新突破算力瓶頸 國産大模型進入成長關鍵期

國産大模型“百模大戰”激戰正酣之際,美國升級對華晶片出口管制帶來新的不確定性。全球供應鏈震蕩之下,國産大模型進入成長關鍵期。

“要堅持源頭創新,提高生成式人工智慧的核心競爭力。”業內專家表示,只有制定高端算力晶片、大模型演算法等基礎性、原創性技術攻關的中長期專項規劃,實現更多從“0”到“1”的突破,大模型才有望突破瓶頸。

算力需求將是未來十年挑戰

近日,美國升級對華晶片出口管制。根據英偉達10月17日在一份文件中披露的受限晶片詳情,包括高性能GPU(圖形處理器)晶片A800和H800。這兩款是該公司專為中國市場設計的AI(人工智慧)晶片。

隨著大模型浪潮掀起,英偉達成了AI淘金時代的“賣鏟人”,其開發的GPU晶片需求井噴。GPU即圖形處理器,被設計用來處理並行計算,更適合同時處理相同類型的大量數據。它最早設計用於處理圖像、視頻和3D圖形渲染,後被引入AI計算,成為大模型訓練與推理不可或缺的算力基礎設備。

“一顆A800晶片的售價已經高達15萬元,半年前,這一價格不過八九萬元。”有晶片經銷商對記者透露,相關存量晶片價格一路看漲。

“儘管中國開發的AI演算法非常強大,但國內硬體的計算能力仍有差距。”科大訊飛創始人、董事長劉慶峰表示,中國企業在訓練AI大模型上面臨的挑戰之一,就是訓練主要是在英偉達的硬體上完成的,企業內部只能做出微小的調優和訓練。

“我相信對計算能力的需求,將會是未來十年對所有人的挑戰。”半導體公司AMD全球副總裁唐曉蕾表示,這不僅涉及對能源、算力的需求,還關係到整個環境改變的需求,“這是一種大勢,跟以前不一樣。”

行業呼喚自主可控算力底座

科大訊飛日前宣佈聯合華為推出基於昇騰生態的“飛星一號”大模型算力平臺,國內的大模型廠商信心得以提振。此外,當天發佈的星火認知大模型V3.0,據稱已全面對標ChatGPT(GPT-3.5),在中文能力上實現超越。

“星火3.0可以説是除了華為內部應用之外,當前第一個真正在國産算力平臺上訓練出來的大模型。”雖然沒有透露新一代昇騰晶片性能參數,但劉慶峰提到,“飛星一號”半年內就實現了星火大模型訓練和推理效率均翻番。“國産算力平臺要有從不好用到好用、再到生態繁榮的過程。如果誰都不往前走一步,那始終無法自立自強。”

自主可控的算力底座也有望解決大模型訓練成本過於高昂的問題。近日,畢馬威中國與聯想集團聯合發佈《普慧算力開啟新計算時代》報告顯示,以構建GPT-3為例,OpenAI數據顯示,滿足GPT-3算力需求至少要上萬顆英偉達GPU A100,一次模型訓練成本超過1200萬美元,這還不包括模型推理成本和後續升級所需的訓練成本。

此前,科大訊飛在三季報業績説明會上表示,公司已于2023年初與華為昇騰啟動專項攻關,讓國産大模型架構在自主創新的軟硬體基礎之上,當前華為昇騰910B能力已經基本可對標英偉達A100,後者是當下AI大模型訓練市場上應用最廣泛的GPU晶片。

做好源頭創新 突破多而不強

截至今年7月底,我國累計有130個人工智慧大模型問世。首批通過《生成式人工智慧服務管理暫行辦法》備案的11個大模型産品也獲批向全社會開放服務。

“對國産大模型而言,亟待解決的問題是多而不強。”北京工業大學經濟與管理學院教授何喜軍表示,因底層技術突破難,很多公司選擇調用較為成熟的大模型,直接應用到原有産品和服務上,技術同質化嚴重,且缺乏源頭創新,高品質落地應用較少。“要建設一批國家級開源平臺、代碼託管及大模型開發測試平臺,確保核心演算法自主可控。”

劉慶峰也坦言,國産大模型必須正視與GPT-4的差距。“國産大模型在複雜知識推理、小樣本快速學習、超長文本處理、跨模態統一理解上距GPT-4還有差距。”他表示,唯有實事求是,才能實現超越。

著重培育源頭創新的步伐正在加快。近日,工信部運作監測協調局局長陶青表示,要夯實人工智慧技術底座,通過科技創新重大項目,著力推動大模型演算法、框架等基礎性原創性的技術突破,提升智慧晶片算力水準,釋放數據價值,強化“根”技術研發。

各大廠商也在扎牢底層的演算法和算力。騰訊集團副總裁蔣傑表示,混元大模型掌握了從模型演算法、機器學習框架、人工智慧基礎設施的全鏈路自研技術。螞蟻集團首席技術官何徵宇也表示,螞蟻大模型走純自研的技術路線,底層算力集群可達萬卡規模。(記者 袁璐)

來源:北京日報  責任編輯:劉松

(原標題:源頭創新突破算力瓶頸 國産大模型進入成長關鍵期)