宏昆控股集團董事長陳芳與新奧萊控股集團董事長劉文獻舉行會談 | 中國職工文化體育協會棋牌分會 二屆一次代表大會在京召開 | 創新驅動 數智融合——首屆醫工交叉手術機器人創新論壇盛大舉行 | 這家成立僅3年的XR品牌 憑什麼超越Meta霸榜亞馬遜智慧眼鏡暢銷榜 | 大模型距離大規模落地還有多遠?學界業界熱議 | 學而思CTO田密:大模型為突破教育行業的“不可能三角”帶來曙光|WAIC 2024 | 智創新 數賦能 中信國際電訊集團亮相2024世界人工智慧大會 | 第一屆“賽昇杯”數智大賽(軌道交通行業) 決賽及頒獎儀式圓滿閉幕 | 抖音電商嚴厲打擊“付費直播會員”相關詐騙行為 | WAIC 2024盛大召開,天翼雲以全棧智算能力賦能AI時代 |
 
當前位置: 新聞>滾動>

WAIC 2024盛大召開,天翼雲以全棧智算能力賦能AI時代

發佈時間:2024-07-08 09:19:34  |  來源:中國網科學  |  作者:  |  責任編輯:科學頻道

0a97310a4b5e7b0f4a07a84626d4dfc3_1720237194846031.jpg

7月5日,2024世界人工智慧大會期間,中國電信星辰人工智慧生態論壇在上海世博中心啟幕。論壇以“星辰注智,煥新領航”為主題,圍繞人工智慧技術發展趨勢,分享中國電信與産業各界在人工智慧領域的創新與實踐。天翼雲科技有限公司董事長、總經理胡志強出席,併發表演講《雲智一體國雲煥新》。他表示,人工智慧已成為新一輪科技革命和産業變革的核心驅動力量。天翼雲堅持科技創新驅動高品質發展,以豐富的智算資源供給、強大的智算服務能力和開放的模型應用生態,為數字經濟發展注入新動能。

8bb333216b5b001131dfa77c1f8e9bc0_1720237198136350.jpg

在智算資源供給方面,天翼雲自建了豐富、多樣化的智慧算力資源。圍繞AI産業集聚地區,天翼雲規劃建設北京、上海、廣東、浙江、安徽人工智慧公共算力中心,提供訓推一體化能力,並先後建成上海、北京萬卡池,這也是全國最早建成並真正投産運作的兩個國産化、全液冷、單集群萬卡公共智算中心;在清潔能源集聚地,建設內蒙、貴州、寧夏智算中心,提供綠色算力;此外,天翼雲還在31省預部署AI雲電腦和推理池,在280多個地市的一城一池節點和1000多個邊緣節點按需下沉AI雲電腦算力和推理算力;提供國內外主流的GPU、NPU算力方案,面向不同場景為用戶提供公有雲、私有雲、邊緣雲多種形態服務。

另一方面,天翼雲匯聚社會多方算力,通過高效調度實現算力供需匹配。天翼雲重點研發算力分發網路平臺“息壤”,從算力統一接入、算數網一體化調度、算力簡便易用三方面進行技術創新,實現裸算力雲化接入、算力更泛在、算力選擇和應用部署更簡單,促進算力互聯互通、高效利用、供需匹配。

基於此,息壤可賦能三大算力服務場景。一是天翼雲自營的公共算力服務平臺,目前已接入多家算力夥伴,擴大了天翼雲算力規模和品類,滿足公有雲客戶的多元算力需求;二是行業算力網際網路,如國資央企智算雲管理調度平臺,接入多家央企算力,提高國資監管水準,提升算力利用率;三是城市算力網際網路,通過整合區域內多方算力,結合産業政策,實現一體化統籌調度算力,目前已在多個區域成功實踐。

當前,基礎大模型訓練呈現參數越來越大的趨勢,在超大規模參數的基礎大模型開發訓練場景中,對AI基礎設施的算力、性能、穩定性都提出了更高要求。天翼雲基於單集群萬卡智算中心,搭載一體化計算加速平臺雲驍和一站式智算服務平臺慧聚,從基礎設施到平臺,構建了基礎大模型訓練解決方案。

在大算力需求方面,天翼雲建設了可橫向擴展的PB級HPFS,滿足存儲要求;組建了低延時的超大規模RDMA網路,滿足基礎算力需求;同時,通過計算、記憶體、通信多維優化,提升綜合算效。在性能方面,天翼雲升級AI框架,編譯效率翻番,通過拓撲感知調度,集合通信效率提升顯著,多種加速優化後將國産算力的綜合算效比提升到了行業可比水準。在穩定性方面,故障訓前發現,結合中斷點續訓能力,實現訓練任務長期穩定、高可用運作。

構建國産萬卡集群不是一萬張卡的簡單堆疊,而是一項高度複雜的系統工程,需要解決超大規模的組網互聯、高效率的集群計算、長期穩定性和高可用性等眾多技術難題。天翼雲基於國産萬卡智算集群和自研智算平臺,已具備支撐萬億參數基礎大模型訓練的能力。

在行業大模型訓推過程中,普遍存在著訓練部署工程化複雜、訓推效率有待提高、訓練中斷頻繁等挑戰。面向行業大模型訓推場景,天翼雲提供一站式智算服務。其中,“慧聚”平臺預置行業數據集、納管國內外主流AI加速硬體、並預置基於國産算力的基礎大模型等全棧工具鏈能力,大模型精調場景通過選數據、選硬體、選模型3步,即可實現大模型訓推;通過自研AI框架、3D並行加速、自研訓練加速庫、容器調度優化等核心技術,大幅提升訓練效率;通過模型量化壓縮、自研推理加速算子庫、自研AI推理加速框架等核心技術,推理效率也明顯提升;通過全鏈路故障分鐘級檢測、定位、告警,全鏈路日誌監控與可視化、中斷點續訓快速恢復等核心技術,實現訓推過程全鏈路監控。

基於技術創新與項目經驗沉澱,天翼雲打造了全面的平臺化能力和解決方案,保障客戶高效、便捷、穩定、安全使用智算服務。

在模型應用生態建設方面,天翼雲在業界率先發佈AI雲電腦。AI雲電腦具有算力更強大、更彈性、更安全、更優惠的優勢,降低大眾使用AI的門檻,加速推進AI普惠化。目前天翼AI雲電腦已接入多個主流通用大模型,以及教育、醫療、法律、心理等多個行業大模型,打造AI應用中心,創新推出AI會議、AI低代碼、AI文檔、AI教育等場景化標桿應用,提升客戶辦公、生産效率。

此外,天翼雲打造紅雲大模型開發者社區,聚合本土中文優質AI資源,加速AI應用創新和商業閉環。通過簡單易用的工具鏈,端到端使能AI應用開發全流程,助力孵化國産原生模型。

大會期間,天翼雲攜智算創新成果亮相世博展覽館,展出了國內領先的單體萬卡液冷智算池、“息壤”“雲驍”“慧聚”三大智算平臺、AI雲電腦以及基於天翼雲智算雲底座的星辰大模型等硬核技術成果,全方位展現在人工智慧領域的深厚實力。

69ecd30665e5df10c30236e96f6c768a_1720237203793749.jpg

人工智慧正成為發展新質生産力的重要引擎,作為雲服務國家隊,天翼雲具有豐富的智算資源儲備、強大的智算平臺能力以及開放的模型應用生態。未來,天翼雲將持續深耕技術創新,攜手産業各界共創智算未來,共贏AI時代。