阿裏雲AI基礎設施獲2024世界網際網路大會領先科技獎

2024年11月19日17:27 中國網科技

新聞爆料: alltech@china.org.cn 電話:(010)82081166-6059

　　11月19日，2024年世界網際網路大會領先科技獎在烏鎮揭曉，阿裏雲面向AI的雲計算基礎設施榮獲該獎，成為世界網際網路大會史上首個以AI基礎設施整體獲獎的科技成果。面向AI時代，阿裏雲全面重構了一個從底層硬體到計算、存儲、網路、數據處理、模型訓練和推理平臺的全棧技術架構體系，成為國內最早自研、佈局最深入的AI基礎設施。目前，80%的中國科技公司、65%的專精特新“小巨人”企業和60%的A股上市公司使用阿裏雲的算力服務。

　　隨著人工智慧加速發展，以CPU為核心的經典計算體系正快速向GPU主導的加速計算體系轉移，同時，AI大模型的訓練數據和應用場景正快速增長，這對底層基礎設施提出了性能和效率的全新要求。大會指出，阿裏雲通過軟硬一體體系化創新，面向AI對雲計算的全棧架構實現了技術全新改造，將數據中心全面升級為一台超級智慧電腦。

　　在計算層，阿裏雲研發出全新的磐久AI伺服器，單機支援16卡、顯存1.5T，並創新AI演算法預測GPU故障，準確率達92%，業界領先；同時，首次推出支援多種生態的Serverless化GPU容器算力，實現ACS容器計算親和度和性能的全方位提升。在存儲層，文件存儲CPFS可為AI智算提供指數級擴展存儲能力，並通過冷熱數據分層大幅節省成本。在網路層，高性能網路架構HPN7.0可穩定連接超過10萬個GPU。在平臺層，人工智慧平臺PAI，已實現萬卡級別的訓練推理一體化彈性調度，AI算力有效利用率超90%；湖倉一體化平臺OpenLake，可提供大數據搜索、AI一體化能力體系；多模數據管理平臺DMS，可實現跨雲數據庫、數據倉庫、數據湖統一治理，幫助業務決策提效10倍。

圖説：阿裏雲AI基礎設施全景

　　基於全棧優化，阿裏雲AI基礎設施的系統穩定性和計算效率大為提升，連續訓練有效時長達到 99%，GPU 使用效率(MFU)提升了 20% 以上。全新打造的阿裏雲靈駿智算集群，可支援10 萬張GPU卡高效互聯，在萬卡規模下的性能線性增長率達到 96%，可提供 20TB/S 的超高吞吐並行存儲，網路有效使用率達到99%的業界領先水準。

圖説：阿裏雲副總裁、基礎設施事業部負責人蔣江偉

　　據介紹，阿裏雲AI Infra相關核心技術已被SIGCOMM、HPCA、ICDE、ACM等多個國際頂級學術會議收錄認可。基於阿裏雲AI Infra打造的通義千問大模型，已成為全球性能領先的基礎模型，服務中國一汽、聯想、微網志、攜程、喜馬拉雅、三得利(中國)等30多萬企業客戶；百川智慧、月之暗面、零一萬物等大部分中國大模型公司都在阿裏雲上進行AI創新；復旦大學、浙江大學等國內50多所院校機構也攜手阿裏雲開展AI for Science的相關研究。

　　世界網際網路大會烏鎮峰會已成功舉辦十年，“領先科技獎”也成為科技領域全年最重磅的獎項之一。此前，阿裏雲有多項自研技術獲世界網際網路大會領先科技成果獎肯定，包括飛天雲作業系統、PolarDB數據庫、神龍虛擬化架構、盤古分佈式存儲、ODPS大數據平臺等，阿裏雲也成為獲獎最多、涉及領域最廣的中國科技企業之一。

(責任編輯：譚夢桐)

免責聲明：中國網科技刊發此文目的在於傳遞更多資訊，文章內容僅供參考，不構成投資建議。投資者據此操作，風險自擔。