超算網際網路是一種以超級電腦和高速網際網路為基礎的先進計算基礎設施,它以高速網路連接分佈各地的超算中心,聚合多個超算中心的軟硬體資源,並通過建設超算資源共用與交易平臺,支援算力、數據、軟體、應用等資源的共用與交易,同時向用戶提供多樣化的算力服務。
楊廣文
國家超級計算無錫中心主任
新基建、東數西算等工程的實施,對於推動算力、演算法、數據、應用資源等的集約化和服務化創新提出了更高的要求,對構建可提供高端算力服務的一體化先進計算基礎設施提出了新的挑戰。
“為了解決我國超算中心運作面臨的挑戰,提升我國超算的應用水準,推動超算中心從提供裸機時向提供多領域應用服務轉變,構建超算網際網路勢在必行。”6月22日,國家超級計算無錫中心主任楊廣文在接受科技日報記者專訪時説。
楊廣文透露,目前我國超算網際網路原型項目研究已取得初步成果,將於近期對外正式發佈。今後,這些成果將能進一步支援智慧計算中心的互聯,並在更高層面上支援未來算力網的構建與營運。
佈局建設超算網際網路意義重大
楊廣文介紹,超算網際網路是一種以超級電腦和高速網際網路為基礎的國家級先進計算基礎設施,它以高速網路連接分佈各地的超算中心,聚合多個超算中心的軟硬體資源,並通過建設超算資源共用與交易平臺,支援算力、數據、軟體、應用等資源的共用與交易,同時向用戶提供多樣化的算力服務。
作為一种先進計算基礎設施,超算網際網路將超算所提供的強大計算變為計算服務,並以一種標準化的形式提供給計算服務的使用者。
“超算網際網路通過制定資源接入、共用、交易等標準,構建具備資源共用與交易能力的公益性資源平臺,可將各級超算中心、雲計算企業、科研機構等不同來源的算力、數據、軟體、應用等統一為超算資源並整合到一起,為科研、生産生活等提供高效、專業的超級計算服務。”楊廣文説。
在楊廣文看來,和傳統的超算應用相比,超算網際網路的最大特點是將提供超算算力轉變為提供超算應用服務,這就帶來了超算網際網路在應用模式上的巨大改變,對超算及其應用的發展具有相當大的推動作用。
在清華大學副教授黃震春看來,作為一種資訊基礎設施,超算網際網路起到了連接下層資源提供者與上層用戶的作用。因此,從商業運營角度來看,超算網際網路的核心服務平臺應當是一個公益平臺,在國家相關部門的支援與指導下應用於超級計算服務市場。
國家超級計算無錫中心研發工程師葉躍進認為,在建設超算網際網路時,要改變超算中心分散獨立運營導致的算力碎片化和資源利用不均衡的局面,實現超算資源的互聯互通和資源共用、交易等;同時,要構建超級計算管理及應用平臺服務體系,提供跨域的統一服務策略和評價指標,提供並行應用軟體,以及軟體的共用與交易機制;此外,還要支援建設面向各領域和重點行業的應用平臺,充分利用國家級超級計算資源,有效支援重點科研與行業用戶,引導、培育超級計算資源和服務的商品化和市場化,從根本上提高我國並行演算法與並行軟體的研發水準,使超級計算更好地服務於科技創新、産業升級等。
“超算網際網路的建設和發展,將在國家層面給出實現全國大數據中心一體化協同創新的高品質解決方案,為開啟算力經濟時代的世紀工程提供堅實的基礎。”楊廣文説。
超算網際網路仍面臨諸多挑戰
“超算網際網路的核心目標是確保超級計算服務實現從傳統的提供算力到提供服務的革命性轉變。”楊廣文説,只有實現了資源的高速互聯,各種超算資源才有可能成為一個有機整體,可能支援面向應用領域的行業或者産業聯合體的形成,構建應用平臺和應用系統,為應用領域和相關産業提供有效的高性能計算應用服務。
楊廣文介紹,目前超算網際網路的構建和運營無論在技術上、人才上還是在商業模式、産業培育上都面臨著諸多挑戰。
從技術層面來看,超算網際網路仍需要通過高速網路高效連接來自不同超算中心和資源提供單位的、分佈異構的超算資源,需要實現算力、存儲、數據等各種高性能計算資源的共用和高性能計算任務的有效調度。
從人才資源來看,超算網際網路的構建與運營涉及到高性能計算、電腦網路、並行軟體、分佈式系統等電腦領域的諸多研究方向,尤其離不開以超算中心為主的超算運營管理與技術開發人才,需要具備相關應用領域和行業專業知識、行業經驗的人才隊伍。
從産業生態來看,超算網際網路構建於超級計算和高速網路的基礎之上,對相關産業生態的依賴非常明顯,從作業系統、基礎軟體到並行應用軟體的開發與優化,這些都會影響到超算網際網路的構建與運營。
“在面向應用領域的專業超算服務産業初期和發展階段,亟須國家在産業政策等方面給予大力扶持,以推動具有技術和市場優勢的企業聯盟或集群快速成長。”葉躍進説。
建設過程中要堅持標準先行
“建設超算網際網路,將有效聚集超算硬體資源和專業人才,並基於超級計算系統研究並行軟體的開發、測試、遷移、共用和服務化技術,支援和鼓勵並行應用軟體的開發。”楊廣文説。
黃震春認為,在超算網際網路的建設過程中,需要遵循標準化、服務化、領域化等一系列原則,以保證超算網際網路的開放性和普適性;尤其要堅持標準先行,這既有利於超算網際網路的合作和推廣,又能通過成熟的標准保證系統的相容、穩定、可用,更能促進相關標準的開放,保證超算網際網路的不斷發展與演進。
我國高度重視超算網際網路工程,並於2020年在重點研發計劃的“高性能計算”重點專項中,專門部署超算網際網路原型項目——國家高性能計算環境領域應用平臺及服務體系研究與構建,目前已在多個方面取得了重要進展。
值得一提的是,超算網際網路原型項目還得到了之江實驗室的大力支援,同時也能更好地支援之江實驗室“智慧計算數字反應堆”重大項目的實施。
楊廣文介紹,超算網際網路原型項目可實現多個國家超級計算中心之間每秒千億字節的高速網路互聯互通,聚合每秒不少於200億億次浮點運算的計算能力和1艾字節的存儲能力。目前超算網際網路的高速互聯採用開放式的架構和標準協議,可支援未來網路頻寬升級和接入更多符合條件的國家級及其他各級超算中心、資源供應商與用戶單位。
同時,超算網際網路建設團隊還針對核心資源網的超級計算系統,研發支撐應用領域平臺構建的技術,設計一套基於核心資源網的應用平臺搭建支撐工具。
相關專家認為,超算網際網路原型項目的順利實施,證明了超算網際網路在技術上的可行性和對行業與多領域應用的強大支撐能力,將為我國科技創新、産業升級、社會發展等提供基於超級算力的專業服務,有效帶動相關産業發展,支撐國家相關戰略的順利實施。