近年來,自動駕駛、生命醫學、智慧製造等領域發展迅速,隨之而來的是超大規模人工智慧(AI)模型和海量數據對算力需求的不斷提高,智算中心建設正當其時。
智算,簡單來説就是專門服務於人工智慧的數據計算中心,是目前主流的算力中心之一,能夠為人工智慧計算提供所需的專用算力,為計算基礎設施帶來新的建設方式。
近日,阿裏雲宣佈正式啟動張北超級智算中心,總建設規模為12 EFLOPS(每秒1200億億次浮點運算)AI算力,超過谷歌的9 EFLOPS和特斯拉的1.8 EFLOPS,成為全球最大的智算中心,可為AI大模型訓練、自動駕駛、空間地理等人工智慧探索應用提供智慧算力服務。
隨著張北超級智算中心的啟用,阿裏雲正式對外開放了這座超級智算中心的技術底座——飛天智算平臺,其可通過公共雲和專有雲的模式服務於各類機構。開發人員可以在平臺上進行數據存儲、數據治理、數據分析、模型開發、模型訓練與推理等。此外,平臺還提供了預訓練模型,語音、圖像、自然語言處理、決策等領域的模型能力,以方便開發者更好地加速AI應用的開發。
算力是這個時代的剛需。從政府主管部門到相關行業企業,都在為提升中國算力總量和水準,優化算力佈局而努力。根深則葉茂,強勁算力能為人工智慧的發展打下更廣闊、更穩固的基礎。
推進智算基礎設施建設
算力是重要的基礎設施,也是關鍵的生産要素。阿裏雲智慧全球銷售總裁蔡英華在飛天智算平臺發佈會上給出過這樣幾項數據:當下的中國,已經有58%的企業在使用人工智慧,遠遠高於全球平均水準,領跑全球;數字化轉型會帶來大量的數據,預計到2025年,中國的數據量將達到486萬億億字節。
此外,我國的算力結構也在發生變化。“十三五”期間,我國算力總規模增長近5倍,通用算力增長3倍左右,智慧算力增長近百倍,智慧算力在整個融合算力中的佔比達到了40%,未來可能會更多。“可以説,算力的發展不僅代表生産力水準的提升,還是産業革新的驅動力。”蔡英華説。
和通用型計算不同,智慧計算需要海量數據對AI模式進行訓練,算力被損耗在數據遷移、同步等環節,這對智慧計算提出了更高要求。因此,智算中心要具備高效算力、AI賦能、自主創新、綠色節能等多種特徵,而建設智算中心,可以推進算力資源的優化配置,賦能各行各業的數字化轉型,帶動實現産、學、研、用多位一體,打造AI産業集群。
工信部數據表示,截至2021年底,我國在用數據中心機架總規模達520萬標準機架,在用數據中心伺服器規模1900萬台,算力總規模超過140 EFLOPS。全國在用超大型和大型數據中心超過450個,智算中心超過20個。工信部資訊通信發展司司長謝存曾表示,工信部將持續推動算力基礎設施建設,統籌佈局綠色智慧的算力基礎設施,推進一體化大數據中心體系建設,加速打造數網協同、數雲協同、雲邊協同、綠色智慧的多層次算力設施體系,實現算力水準的持續顯著提升,夯實數字經濟發展“算力底座”。
科研是智算中心的核心應用場景
在生命科學領域,北京深勢科技有限公司採用飛天智算平臺之後,將集群性能優化提升超過100%,讓分子動力學倣真模擬訓練效率提升了5倍;在工業領域,智己汽車科技有限公司通過飛天智算平臺提供的高性能計算,將智慧駕駛訓練效率提升了70%,加速了新車型的研發上市……這些只是智算中心服務於科學研究的一個縮影。
阿裏雲智慧副總裁、行業解決方案銷售部總經理霍嘉直言,很多高校和科研機構的研究人員本身不是學電腦的,但他們的確需要人工智慧來完成他們的研究,專業知識與網際網路技術之間的隔閡,成為困擾研究人員的一大痛點。
據阿裏雲大計算産品研發負責人曹政介紹,“相較于一般數據中心,智算中心除了對算力規模和效率的要求大大提高外,還需要為客戶提供軟體平臺層的産品和服務,這是實現算力落地應用‘最後一公里’的關鍵。”曹政説。
“如今,人們需要的是‘開箱即用’的智慧計算服務,這是最真實的需求。”霍嘉表示,在AI開發層,該智算中心可以提供“大數據+AI”一體化平臺支撐開發與運維全流程,尤其在模型訓練環節,分佈式訓練框架可以對分佈式策略進行自動組合和調優,將訓練效率提升了11倍以上。此外,該智算中心還為用戶提供了一站式的通用推理優化工具,可對演算法模型進行量化、剪枝、稀疏化、蒸餾等操作,將推理效率提升6倍以上。此外,阿裏雲還同步啟動了另一座位於烏蘭察布的智算中心,其建設規模為3 EFLOPSAI算力。這兩座超大規模的智算中心正在服務於AI大模型訓練、遙感探測、數字人、自動駕駛、元宇宙等前沿智慧應用。