訓練需求井噴 “算力之渴”何解
近日,《算力基礎設施高品質發展行動計劃》印發,算力整體佈局持續優化,全國上下已形成積極推動算力産業快速健康發展的局面。工信部數據顯示,截至2023年6月底,全國在用數據中心機架總規模超過760萬標準機架,算力總規模達到197百億億次/秒,算力總規模近5年年均增速近30%,存力總規模超過1080EB。
與基礎設施建設相同步,算力融合應用加速涌現。根據中國資訊通信研究院(以下簡稱中國信通院)的測算,2022年我國算力核心産業規模達到1.8萬億元。算力每投入1元,將帶動3至4元的GDP經濟增長。
但與此同時,大模型産業井噴式發展也帶來算力緊缺、能耗激增等問題。目前國內已有100多個大模型公開發佈,這加劇了智慧算力緊張的局面。面對需求的暴增,“算力之渴”如何解?
“綠化”算力全産業鏈
“我們正在推動液冷、間接蒸發自然冷卻等節能技術的應用,並在部分算力中心開展試點。同時,我們正推動數據中心企業啟動氫燃料電池等綠電在數據中心的試點,梳理10個‘小散老舊’數據中心(約4000個標準機架),預計將於年底前全部完成數據中心改造任務。”近日,在工業和資訊化部新聞宣傳中心(人民郵電報社)、中國郵電新聞工作者協會等單位聯合組織的“算力中國行”大型調研採訪活動中,上海市通信管理局資訊通信發展處副處長魏徵對記者表示。
滿足算力需求,除了增加算力供給規模以外,數據中心的“降耗增效”也正在緊鑼密鼓地進行。目前,從政府到企業,各個主體都在積極探索優化數據中心製冷系統,提高算力應用環節效率。
近日,螞蟻集團與中國信通院發佈《面向算力應用環節的計算綠色化白皮書》(以下簡稱白皮書),白皮書顯示,截至2023年6月,我國累計建成196家國家綠色數據中心,行業內先進綠色中心電能利用效率降至1.08左右,達到世界領先水準。但伴隨産業發展,PUE指標(即評價數據中心能源效率的指標)的優化空間不斷減少,局限性逐漸顯現。
螞蟻集團首席技術官、平臺技術事業群總裁何徵宇坦言,算力由數據中心的伺服器提供,但實際上大量的電能都被用於維持伺服器的正常運轉,而並沒有供給計算服務本身。根據統計數據,目前的數據中心可能只有低於20%的電能用於計算本身。
白皮書也提到,在推動算力綠色低碳發展的過程中,行業的關注點仍主要停留在可再生能源生産和綠色數據中心建設上。為了實現更大程度的總體節能減排效果,需要重視“端到端的綠色計算”。
端到端的綠色計算,即從電力生産、算力生産(包括智算中心建設商、硬體廠商、雲廠商),到算力應用全産業環節的綠色計算。據何徵宇介紹,在電力生産環節,主要通過優化用能結構,實現數據中心清潔能源和新型儲能的合理利用,圍繞源網荷儲一體化的微電網並網模式,探索數據中心與能源融合發展的綠色新場景;在算力生産環節,通過應用高能效綠色硬體技術與産品,以及從選址、設計、施工、運營等環節入手提高數據中心全生命週期綠色化水準,推進數據中心節能減排改造與綠色低碳化重構,並採用高效IT系統、製冷系統、供配電系統以及輔助系統,協調促進算力綠色生産與綠色傳輸;在業務應用環節,要注重提高軟體平臺對計算資源的利用率,提升應用與演算法效率,將固有計算資源通過動態、彈性的方式進行調配,減少算力應用側能源消耗,實現算力在服務環節的綠色低碳。
白皮書強調,算力應用環節的綠色計算,是智慧算效提升空間最大、收效最快,也是尚未被足夠重視的部分。
提升算力調度水準
當前,算力網路快速融合,多樣的算力需求提升了對異構算力網路的需要,而將不同類型的算力資源高效精準地調度到相應需求的資源節點中,就需要進行算力調度。
讓算力像水、電一樣流動,供有需要的企業按需取用,是算力調度的理想狀況。近兩年,國內涌現出一大批算力調度平臺,這些平臺可通過整合不同來源、類型和架構的算力資源,滿足豐富的業務應用場景需求。今年6月,我國首個實現多元異構算力調度的全國性平臺“全國一體化算力算網調度平臺”發佈。
中國工程院院士高文表示,我國算力網路面臨的兩大技術挑戰,其中之一就是算力調度挑戰。目前雲算力、智慧算力、超算算力、混合算力的服務商入口、系統、計費標準等均不相同,這為算力調度帶來了一定挑戰。
中企通信數據科學及創新總監詹東東也表示:“尤其對於雲計算和邊緣計算協同的算力架構而言,最重要的是對算力的調度能力。對算力的需求很多時候會分佈在不同的區域,如何協同好這些算力,是很多客戶正在思考的問題。”
國家(上海)新型網際網路交換中心(SHIXP)是算力調度、交易的重要試點。記者了解到,SHIXP主要負責本地區的算力網路和算力中心的算力調度,並於今年7月底正式上線了全國首個算力交易平臺。目前,SHIXP已建成算網節點14個,吸納入駐企業40家,接入國內主流運營商8家、總頻寬1.82T,累計等級算力資源超過156千萬億次/秒。
“我建議,全國要建一個大的算力調度標準。”魏徵表示,統一標準的建立,意味著所有的雲服務商要對外提供統一、可度量的算力服務,既保證現有運營商資源的直接輸出,也保證他們在未來統一市場的可持續發展。
推進國産化軟硬體適配
隨著人工智慧技術的大爆發,特別是大模型時代的到來,通用大模型正快速向行業垂直應用領域推進。通過模型調優與快速迭代,垂直大模型正在釋放前所未有的産業數智新動能;同時,智算資源緊缺、國內産品相對不足的痛點也更加突出。除了硬體製造能力,在底層技術開發、軟體生態適配和場景落地實踐等方面,中國算力産業還需長足進步。
上海市通信管理局二級巡視員葛倫卿表示,目前我國在算力供給方面,還面臨著國産適配性較差等問題。目前很多國産晶片廠商都在做自研或相容開源生態軟硬體,企業間的低效競爭等問題愈發突出。針對這些問題,聯盟、協會等行業組織要凝聚共識,幫助算力供給方打破技術和生態壁壘,加強國産化軟硬設備的研發與應用。
工業和資訊化部相關負責人表示,圍繞算力發展需要,應增強自主創新能力,推進計算架構、計算方式和演算法創新,加強CPU、GPU和伺服器等重點産品研發,加速新技術、新産品落地應用;同時,圍繞算力相關軟硬體生態體系建設,將加強硬體、基礎軟體、應用軟體等的適配協同,提升産業基礎高級化水準。(記者 崔 爽)
來源:科技日報 責任編輯:劉松
(原標題:訓練需求井噴 “算力之渴”何解)