華為以集群優勢助推算力破局
5月下旬,在華為召開的鯤鵬昇騰開發者大會2025,華為方面宣佈推出昇騰超節點(超級計算節點)技術,成功實現業界最大規模的384卡高速總線互聯,性能達到人工智慧(AI)晶片業界先進水準,引發關注。
華為公司相關負責人近期接受記者採訪時表示,在單晶片相對落後的情況下,華為用數學補物理、非摩爾補摩爾,用集群計算補單晶片,推動達到相關效能。
不少業界人士表示,繼年初DeepSeek R1成功突破“中國能否訓練世界領先大模型”的疑慮後,昇騰超節點技術近期又給中國人工智慧産業打了一針強心劑,即“國産算力平臺也能訓練世界領先大模型”,彰顯AI産業不斷取得顯著進步。專家建議,還需持續加強“集群優勢”、攻堅關鍵技術、推動生態建設,促進人工智慧産業高品質發展。
重要突破 算力反擊
“最困難的時候已經過去。”近期,華為公司相關負責人接受記者採訪時表示。
人工智慧是全球科技競爭的關鍵領域,當前,在産品端領域,大模型是國際業界競爭的焦點,今年初DeepSeek R1的出現,證明了中國AI的能力、提振了士氣。
近期,華為推出的昇騰AI計算平臺“CloudMatrix 384”超節點集群,達到單集群300 PFlops(PFlops:每秒一千萬億次浮點運算),能效比達到行業先進水準。
華為公司相關負責人介紹,昇騰在大模型訓練領域也取得重大突破,如訓練出的參數規模達7180億的全新模型盤古Ultra MoE。據報告披露顯示,其訓練效率(MFU)從行業普遍的約30%提升至41%以上,實驗室已達45%以上。
同時,華為還通過昇騰AI計算平臺訓練參數量為720億的盤古Pro MoE大模型,通過動態激活專家網路的創新設計,效能可媲美千億級模型性能。在業界權威大模型榜單SuperCLUE最新公佈的2025年5月排行榜上,位居千億參數量以內大模型排行並列國內第一。業界人士認為,這意味著國産AI基礎設施的自主創新能力得到了進一步驗證。

圖為昇騰晶片。 (受訪者供圖)
系統工程 效能躍升
記者採訪了解到,“CloudMatrix 384”超節點通過系統工程創新,實現比肩行業先進的效能。
超節點的前提,是具備384張卡之間百納秒級互聯的能力,以及解決散熱、提升模型訓練效率(MFU)等問題的能力。
華為公司相關負責人表示,昇騰超節點在通信方案中採用了光纖,並創新使用了更加“晶片親和”的數學表達,基於系統工程的方法,對計算、記憶體、通信進行優化調度,實現業務驅動的系統最佳匹配,推動訓練效率、推理性能再上臺階。
業界人士介紹,相比單晶片的提升路徑,系統工程帶來的提升效率更高。如從單晶片來看,每代帶來的性能提升不超過20%。
而通過高效的超節點系統,在硬體沒有改變的情況下,實現資源的高效調度,整體效能的提升相當於兩至三代晶片工藝演進,一定程度彌補了工藝的不足。
這是一場“算力會戰”。華為公司相關負責人表示,在研發過程中,包括華為雲、海思、2012實驗室、計算産品線、光網路等多部門數萬華為員工聯合作戰,能夠産生協同效應和系統工程的整合,實現了“大雜燴”技術的有效利用和協同創新。
“我們還成立了小巧靈突擊隊,對企業客戶派出專家團隊,支援他們使用昇騰晶片訓練自己的大模型,很多客戶興趣強烈。”華為公司相關負責人説。
建設生態 久久為功
在整體效能取得提升的同時,相比行業先進,昇騰AI晶片的生態建設仍存一定短板,不少用戶需要投入大量精力進行開發和維護。
一些業界人士表示,如英偉達通過CUDA平臺,打造了豐富的開發工具和成熟的生態鏈,形成全球開發者共建的開放社區。
華為公司相關負責人表示,“我們通過提供‘Day0遷移、一鍵部署’等技術工具,幫助他們一天內遷移到昇騰生態上,全力支援客戶用好昇騰。”
紮根基礎研究,持續創新。華為公司相關負責人表示,一方面公司大量投入基礎研究,與高校進行聯合研究和技術合作,不斷沉澱組織能力,做到“根深”;另一方面,華為專家也深入業務會戰,創造性解決實際業務難題,提升産品競爭力,創造商業價值,做到“葉茂”。研究和創新有機地結合起來,最終助力實現“根深葉茂”。
展望未來,AI競爭更是能源競爭。“AI計算將來可能無處不在,華為將持續通過技術進步改進能源消耗,構築AI時代的核心競爭力,實現可持續發展。”華為公司相關負責人説。






8b52fc1f-ba38-4ab5-bc16-6bb53c31c986.png)







