在美國鹽湖城舉行的2016全球超級計算大會上,由中科院軟體所楊超率領的研究團隊,憑藉“千萬核可擴展大氣動力學全隱式模擬”研究成果獲得“戈登·貝爾”獎,實現了我國在此獎項上零的突破……
“Ten Million……”
評委剛念出“Ten”,楊超“噌”就站了起來。從座位到領獎臺,他不知道自己是怎麼“移動”過去的,也聽不清那些“Congratulation”(祝賀)從哪來。當地時間11月17日,美國鹽湖城,有高性能計算“諾獎”之稱的“戈登·貝爾”獎迎來了首個中國面孔。
閃光燈晃個不停,37歲的楊超手捧證書,整個人有點懵,心裏嘀咕:真的獲獎了……
“團長”變“旅長”
獲獎項目“千萬核可擴展大氣動力學全隱式模擬”(Ten Million-Core Scalable Fully-Implicit Solver for Nonhydrostatic Atmospheric Dynamics),如投入使用,理論上可大幅提升天氣預報的計算精度和運算速度。
楊超眼中,“隱式”是得獎的“功臣”。“隱式”是隱式求解器的簡稱,而“求解器”就像高性能計算的“發動機”,讓程式“高速運轉”。楊超是研製“發動機”的工程師,也是這次獲獎團隊的“頭頭”。
求解器分兩種,一種是顯式,一種是隱式。“顯式是小步快跑,像小風扇,結構簡單;隱式則是大步、穩健地跑,像馬達,但結構複雜、操作難度大。”楊超對科技日報記者説。
由於公認的技術難關,學界一度並不看好隱式在新型超級電腦下的發展,“用它的人很少”;相比之下,顯式則更受同行青睞。但早在讀博時,楊超便看準了隱式的潛力,“它更具優勢”。
作為軟體的求解器,其本身無法展示效果,要結合具體領域的應用。恰如“發動機”只有安裝在“汽車”上才能一顯身手,而楊超偏選了輛難開的“車”——大氣動力學,把求解器運用在大氣動力學方程計算中。大氣是業內公認的“硬骨頭”,可楊超覺得“要做就做有挑戰的。”
博士畢業後,楊超開始了在大氣應用領域的求解器研究。可要想軟體唱戲,還得有硬體搭臺。今年的獲獎項目是搭載在千萬核的硬體環境中,可十年前國內的硬體水準還很有限(“核”就是CPU的計算核心)。
“‘核’就相當於一個兵,帶領一千萬人的超級計算部隊,那是什麼感覺?就像一個將軍在帶兵打仗。”而彼時的楊超只是個“團長”,測試環境僅有幾千核。
“天河一號”的問世,讓“團長”變“旅長”,楊超做到了整機8萬核CPU模擬。
“天河一號”發佈前3天,經導師孫家昶介紹,楊超帶著研究了3年的應用軟體去往天津。程式在“天河一號”運作的那一刻,8萬核的驚人速度,楊超感嘆“達到了頂峰”。
首次衝獎 只為理想而戰
很快,這次測試引起了業內的關注,紛紛請楊超去作報告,其中就有清華大學電腦係副教授薛巍。楊超受邀去清華園,當他展示出8萬核的計算結果時,有人説了句“這個應該衝擊戈登·貝爾!”
“戈登·貝爾”獎是楊超心中的夢,很美,卻“遙不可及”。所以,當時楊超“只當是同行開個玩笑”。
幾個月後,薛巍借鑒楊超8萬核CPU模擬中的關鍵方法,將其用在氣象應用“GRAPES”上,效果很理想。看到應用如此順暢,楊超心動了。“一輩子可以搏的事情不多,但戈登·貝爾算是一個。哪怕失敗了,曾經為此努力過就夠了。”
“天河一號”是由7168顆CPU和7168塊GPU(圖像處理器)組成,而首次嘗試時楊超只用滿了CPU,GPU完全沒有用上。怎麼能把GPU用起來?這成了“衝獎”的一道坎。
為了解決這一難題,薛巍引薦了一位GPU專家——當時清華大學地球系統科學研究中心副教授付昊桓。2011年底“衝獎突擊隊”正式成立,此時距離交稿只有不到半年。“一般衝獎最少也要三年,這幾乎是一項不可能完成的任務”。
進入“備戰”狀態的楊超,設立好階段性“小目標”;隔幾天就向團隊成員彙報一次,“沒完成任務都不好意思見面”。那時,從中科院到清華園的成府路上,總會看到一位行色匆匆的學者;他沒有假期,只有全力以赴和夜以繼日。
趕在截止日期前,熬了幾個通宵的“突擊隊”,提交了論文。饑腸轆轆的三人來到一家拉麵館,累得已經吃不動了;盯著面發呆,記不得是誰説了句“再也不幹了!”
找到“最後一枚碎片”
幾個月後,入圍名單公佈,並沒有“突擊隊”,中國超算顆粒無收。
“不幹了”只是氣話,“戈登·貝爾”情結深埋楊超心頭,並開始生根發芽,直至枝繁葉茂。
之後的幾年,團隊密切跟蹤國內頂級高性能電腦的研發趨勢,先後在“天河一號”“天河二號”“神威·太湖之光”上進行關鍵技術研發和測試。“只要有機器可用,就想方設法第一時間進行操練。就像蜜蜂聞到了蜂蜜,一下子就撲上去。”
另一方面,楊超不斷調試隱式求解器,卻一直找不到“發動機”的一個零件,無法超越顯式。當時,隨著各類新型超級電腦的發展,顯式求解器在學界出盡風頭,隱式則鮮有問津。難道真是無解嗎?
直到2015年11月,受國外一篇論文的啟發,楊超找到了那個關鍵“零件”,隨即聯繫其他成員,“我們拼圖的最後一枚碎片找到了!”——拉開了二戰“戈登·貝爾”的序幕。
然而,找到“零件”只是開始。怎麼裝進去、是否適用、能否順暢運作……一連串的問題都等著楊超去解答,“每一步都異常艱辛”。
那段時間,楊超常常工作到深夜,飯館、食堂都關了,餓了就去中科院旁的快餐廳。“我知道,北京晚上三點的肯德基、麥當勞是什麼樣。”
直到交稿前一週,終於完成了“零件”調試和優化工作。時隔4年,2016年4月楊超再次提交了參賽論文。
與上一次衝獎相比,這次“衝獎小組”更有底氣,也得到多方的支援,但楊超依舊忐忑。“戈登·貝爾獎設立近30年,中國團隊連入圍都沒有過,評委來自美國、日本,他們會認可中國人嗎?”楊超沒底。
而更令他擔心的是,高性能計算技術迭代之快,倘若本次衝獎失利,目前的方法或迅速就被其他團隊學習或趕超。到那時,多年的心血將付之東流。
“打光了槍裏的每發子彈”
6月的一天,楊超的手機被打爆了——“有兩組中國團隊入圍了,咱們呢?”他連忙查郵件,笑容洋溢在他的臉上。
來不及慶祝,一項更艱巨的任務等著他們——優化求解器。入圍郵件寫明,要在8月10日前提交終稿。4月份上交的隱式求解器性能已超過顯式不少,但是卻未能充分體現隱式的優越性。於是,楊超領隊再次揮師南下,在國家超算無錫中心,把程式裏裏外外修改、調試了一遍,“幾乎重寫了一篇論文”。最終,把隱式求解器的性能提升了4倍,達到同等顯式的89.5倍。
“這麼短的時間,論文能有如此改進,超出想像!”評獎委員會副主席松崗聰教授如是評價。
七八月的無錫,酷暑難耐。38℃的機房,空調只供應到下午4點。到了晚上,所有人只能靠電扇和清涼油解暑。衝刺階段,幾天沒合眼的楊超,感覺地都是軟的,整個人“飄飄欲仙”。
萬事俱備,只差最後一槍。美國時間11月17日上午,在2016全球超級計算大會上,楊超走上臺,鞠躬,點開第一頁PPT,開始了“豪情萬丈”的成果演示。
學術彙報多以低調、沉穩風格為常,但這次楊超一反常態,把極致灌注在PPT的字裏行間。他不想留遺憾,“要讓世界看到中國超算的風采”。結束演講,他説“我打光槍裏的每發子彈”。
下臺後,評獎委員會主席蘇博哈什·塞尼博士握住楊超的手,説“Well done!”(做得很棒)
“這只是開始。”楊超指著獎狀對記者説。他説的是中國超算,更是自己——一顆顆子彈又開始上膛待發。
(責任編輯:羅伯特)