九三學社社員講述中國超算逆襲之路

發佈時間: 2018-08-16 09:05 | 來源: 團結報團結網 | 作者: 孔瑤竹 | 責任編輯: 王靜

2018年8月5日,國家超級計算濟南中心宣佈:核心器件全部獨立自主研發的神威E級超算原型機順利通過科技部專家組驗收,投入使用,為我國在2020年研製成功百億億次電腦打下堅實基礎。

九三學社社員、國家超級計算濟南中心主任張雲泉介紹,“E級原型電腦將在全球氣候變化、空氣動力學、新藥設計、新材料發現、海洋大數據、人工智慧等領域發揮重要作用。”“通過超級電腦的加入,可以把過去新藥合成的侯選化合物發現週期,從過去的幾年時間,縮短到幾星期的時間,極大地降低新藥的研發成本。”

“神威·太湖之光”初露鋒芒

超級計算,簡稱超算,也叫高性能計算,在科學與工程領域應用非常廣泛,它與理論研究、科學實驗一起成為人類探索未知世界的三大科學手段,被稱為支撐科學發現的第三個支柱。

超算也是人工智慧的重要支援平臺,為人工智慧提供強大的算力支援。可以説超算與國民經濟、工業企業創新、國防科技、國家安全等國計民生的方方面面都息息相關。

而用於高端能力計算的高性能電腦也被譽為電腦中的“珠穆朗瑪峰”。

2017年11月,美國超算大會公佈新一期全球超級電腦500強榜單,中國自主晶片研製的“神威·太湖之光”超級電腦再次蟬聯榜首,以每秒12.5億億次的峰值計算能力、每秒9.3億億次的持續計算能力實現“四連冠”。

“神威·太湖之光”完全採用“中國芯”——“申威26010”眾核處理器——這個只有5釐米見方的小小薄塊整合了260個運算核心,數十億電晶體,達到了每秒3萬多億次計算能力,單晶片計算能力相當於3台2000年全球排名第一的超級電腦,1分鐘的計算能力相當於72億人同時用計算器不間斷計算32年,相當於200多萬台普通電腦——它也是全球第一台運作速度超過10億億次/秒的超級電腦。

“核武器都要靠超算模擬,核禁試會禁止所有地下核實驗,只能用超級電腦模擬,如果沒有這個能力意味著核武器的落後,落後就要挨打。”

神威·太湖之光’超級電腦已經應用於若干代表未來“黑科技”的研究領域,涉及天氣氣候、航空航太、先進製造、生物醫藥、新材料、新能源等20個方面,支援國家重大科技應用、先進製造等領域計算任務幾百項。”張雲泉説。

“神威E級超算原型機”再發神威

E級超算是指每秒可進行百億億次數學運算的超級電腦。作為大國綜合實力的象徵、衡量科技創新實力的標誌,E級超算已成為當前各國競相角逐的戰略制高點。E級超算將在解決人類共同面臨的能源危機、污染和氣候變化等重大問題上發揮巨大作用。目前,美國、日本及歐洲等國家和地區先後提出了自己的E級超算研發計劃,我國也將E級超算的研究寫入了國家“十三五”規劃。

E級電腦作為新一代資訊技術領域的大科學裝置,對交叉學科的推動效應、對科技研發的支撐效應、對高層次人才的凝聚效應、對相關産業的帶動效應相當顯著,是新舊動能轉換的強勁引擎。

神威E級原型機由硬體、軟體和應用三大系統組成。硬體系統由運算系統、互連網路系統、存儲系統、維護診斷系統、供電與冷卻系統組成,軟體系統由基礎軟體、並行作業系統環境、存儲管理系統、並行語言及編譯環境組成,應用系統由行業應用計算平臺、人工智慧框架和典型示範應用組成。

面向E級電腦研製需求,研製團隊在多態融合計算體系結構、新一代申威眾核處理器、互連網路、軟體定義海量存儲、高效供電和強化相變冷卻等方面,取得了重大技術突破,對E級電腦研製方案和技術路線進行了全面系統驗證,為E級電腦的研製成功鋪平了道路。

晶片完全自主可控

1996年,為加強我國高端並行電腦系統的研製,國家並行電腦工程技術中心正式掛牌成立,開始了神威系列大規模並行電腦系統的研製。近年來從神威藍光、神威太湖之光,到神威E級原型機,我國已經走出了一條核心技術自主可控之路。

神威E級原型機的處理器、網路晶片組等核心器件全部實現國産化。運算系統全部採用具有完全自主智慧財産權的申威26010+眾核處理器構建;高速互連網路系統全部採用完全自主智慧財産權的申威網路交換晶片、申威消息處理晶片構建;存儲和管理系統採用申威多核處理器構建,實現了對該領域産品的國産化替代。

軟體生態日益完善

隨著神威系列超級電腦系統的部署與應用,神威系列超級電腦系統從基礎軟體、並行作業系統、存儲管理系統、並行語言、編譯環境、高性能數學庫到應用軟體等生態得到日益完善。系統軟體由完全自主研發的神威睿思作業系統、神威睿智編譯器、高性能數學庫等構建,在此基礎上,神威E級原型電腦首次在國産超級電腦上構建了人工智慧軟體生態鏈,基於神威深度學習庫和框架,開展了對弈系統、醫療影像識別、機器翻譯多個大規模人工智慧應用,其中機器翻譯應用的數據規模、並行規模和訓練速度世界領先。

截至目前,E級原型電腦已完成包括全球氣候變化、海洋數值模擬、生物醫藥倣真、大數據處理和類腦智慧等十二個領域的35項重大計算任務。其中,22項應用具備擴展到E級電腦整機規模的能力,6項應用入圍被稱作超級計算應用領域諾貝爾獎的“戈登貝爾獎”。

未來應用前景廣闊

神威E級電腦系統研製始終與應用緊密結合,應用領域日益拓寬,從氣候氣象預報、深空/深海/深地探測、生命科學、天體物理、航空航太等國家戰略領域,進一步拓展到網際網路、雲計算、大數據、人工智慧、基因測序、金融計算、先進製造、現代海洋等領域。神威E級電腦作為大科學裝置,一方面為國家海洋強國戰略打造“深藍大腦”,另一方面滿足健康醫療、航空航太、氣候氣象、生物資訊、先進製造等領域的一批國家科學與工程計算重大需求,成為促進國家科技創新、經濟發展以及中國製造走向中國創造的助推器。

刻在里程碑背後

“神威係”“大顯神威”的背後,是科學家們長期不懈的追逐和創造。

十幾年來,張雲泉在各個場合和媒體為中國超算的發展“鼓與呼”,他認為:一是要抓住歷史機遇,將我國超算的發展模式從超算機器性能拉動,向應用需求拉動轉變,探索出一條健康的超級計算系統發展道路。二是成立若干國家級超算行業應用軟體國家工程實驗室,制定我國超級電腦應用中長期研究規劃和路線圖。三是轉變“重硬輕軟”思維,持續穩定支援超算應用軟體研發。四是鼓勵國家超算中心聯合應用部門組建行業應用聯合實驗室,進行程式移植,自主研發大型並行應用軟體。五是重視計算科學學科建設和人才激勵機制。推廣“超算理論+多學科應用”課程,促進多學科交叉融合。六是加強人才隊伍的建設,為超級計算的發展提供源源不斷的人才供應,“將超級計算與大數據和人工智慧等進行深度融合創新,將成為進行新舊動能轉換的主要手段。”張雲泉説。

在努力為中國超算研究掃除障礙、創造條件的同時,張雲泉也在不斷通過自己的研究為中國超算跨越式發展做出應有的貢獻。

過去十幾年,張雲泉研究員的主要工作是做為項目負責人為神威超級電腦研發了三代高性能數學庫,為包括申威系列處理器在內的多款國産處理器研發國産高性能多核和眾核並行數學庫CLeXML和WeXML,主要包含BLAS、LAPACK、FFT、直接解法器和迭代解法器等模組,具有完全自主智慧財産權,遵循國際主流高性能數學庫介面標準,且性能高於國際主流高性能數學庫。高性能數學庫作為支援2016年我國首次獲得戈登貝爾獎的三大底層技術之一,獲得2017年中國科學院傑出科技成就獎。

然而,做國産超算軟體的研究必然是困難重重,最大的困難還是沒有先例可循。張雲泉説,在研發高性能數學庫核心演算法時,需要深入體系結構層面利用組合語言高效實現核心演算法的核心迴圈性能,在我國自行設計的申威處理器上開展這種優化工作是開創性的,國內外可參考借鑒工作少。“我們創新性的提出了一種適用於數學核心演算法的“模板法”優化方法AUGEM,用於自動提升多種關鍵核心函數的性能,具有重要的實用價值,相關工作已發表在CCF A類國際高水準會議SC和PPoPP上。”

神威E級原型機的研製成功,標誌著研製E級電腦的技術條件和工程條件全面就緒,E級計算正擁抱未來。

神威E級電腦于2020年完成研製部署,將率先跨越百億億次量級臺階。採用的新一代眾核處理器有望成為世界運算速度最快的處理器,節點規模可擴展至數十萬量級,支援系統性能從1E到10E量級的跨越。E級電腦將面向國家戰略需求,解決一批科學與工程計算領域的重大課題,為國防安全和經濟建設提供國際領先的計算環境。

人物檔案:張雲泉,博士,九三學社中央科技委員會委員、九三學社中科院委員會委員、第三支社主委;中科院計算所研究員,博士生導師,國家超算濟南中心主任。

主要研究方向為大數據並行處理、並行程式設計和性能評價、並行計算和並行編程模型等。已在國內外學術刊物上發表論文二百餘篇,出版專著一部,譯著七部。曾獲2000年國家科技進步獎二等獎一項,2017年首屆CCF青竹獎獲得者,2017年中科院科教成果一等獎,2017年中科院傑出科學與技術成就獎,2017年度國際艾奇獎。中國大數據産業應用協同創新聯盟執行理事長,全國高校人工智慧與大數據創新聯盟常務副理事長,ACM中國常務理事,中國軟體行業協會常務理事,中國電腦學會常務理事/高性能計算專業委員會秘書長。中國高性能電腦TOP100排行榜創始人和發佈者,PAC大賽創始人。 一百多次擔任國際會議程式委員會委員和程式委員會共同主席。果殼網科學顧問,光明日報科譜專家委員會委員,青海省大數據與雲計算諮詢專家委員會委員,貴州省農業大數據專家委會會委員,鄭州市智慧城市專家智庫特聘專家。(孔瑤竹)