仲夏時節,國防科技大學的“天河”大樓裏,機房內長達數十米的機殼整齊排列著,指示燈明暗交錯,發出高速運轉的低沉“嗡嗡”聲。這就是我國六度稱雄全球超級電腦500強榜單,讓“中國速度”震驚世界的“天河二號”。此時,作為“天河二號”副總設計師的肖立權正如片刻不停閃爍的指示燈,帶領團隊攻關新一代高性能電腦,向新的“中國速度”發起衝鋒。
“走別人沒有走過的路”
1997年,博士畢業留校後的肖立權成為國防科技大學電腦學院電腦研究所的一名科研人員。從那時起,他就與巨型機一起成長,參與了“銀河”“天河”高性能電腦多代機型的研製過程,從一個普通的科研人員一步步成長為今天國防科技大學超級電腦團隊的核心骨幹。
“走別人沒有走過的路,太難!但我喜歡挑戰!”這是肖立權時常挂在嘴邊的一句話。20世紀末,大規模電腦系統中通常採用的電互聯技術傳輸速率低且易受干擾,成為我國研製千萬億次級超級電腦路上的一塊“絆腳石”。如何搬開這塊“絆腳石”?用光互聯替代電互聯好像是唯一的最優解。研究所將這一任務交給了肖立權。2003年,受領任務後的肖立權立即將科研準星瞄向了該技術難題。然而,按照自己思路做出來的系統根本跑不起來。解決思路一次次提出,但又一次次被推翻。某一天,正在做實驗的肖立權突然冒出一個想法:“是不是數據傳輸有問題?”靈光乍現,他找到了解決問題的“鑰匙”,隨即逆向思維反推,最終找到癥結所在。
這一刻,我國光互聯技術在大規模電腦系統中得到有效驗證,為後續該技術在超級電腦系統中的應用奠定了堅實基礎。此後,肖立權馬不停蹄,瞄準這一技術領域,拿下了一隻又一隻“攔路虎”,解決了光互聯替代電互聯的系列技術難題,成功研製出我國首臺採用光互聯技術的並行電腦互聯通信系統。
2010年11月,“天河一號”憑藉優異性能登上世界超算500強榜首,中國超算首次問鼎世界超算桂冠,五星紅旗飄揚於世界之巔;2013年6月,“天河二號”輕鬆摘奪世界超算500強桂冠,我國超級電腦研製達到世界領先水準……2015年11月,“天河二號”六次問鼎世界超算500強,“中國速度”繼續領跑世界。
“只有掌握自主核心關鍵技術,才能在國際上掌握髮言權”
作為“天河一號”“天河二號”的副總設計師,這些耀眼成績的背後,是肖立權瞄準世界高性能電腦技術前沿,不懈探索創新的豐碩成果。高速互連通信是決定大規模並行電腦系統實用效率的關鍵,美國對中國嚴格封鎖高速互連技術轉讓。當時,“天河一號”在國內首次創新性地採用了“CPU+GPU”異構融合體系架構,其內部數萬個CPU和GPU需要通過互聯通信系統實現資訊交換,難度可想而知,組織並全面負責互聯通信系統自主設計研製任務的肖立權經常鉚在試驗一線,從原理驗證到工程實踐,一個環節都不放過。團隊在他的帶領下,開展關鍵技術、核心技術攻關,成功將“天河一號”送上世界超算第一的寶座。
短暫的喜悅過後,肖立權又開始了緊張的工作,在原有基礎上,他帶領團隊進行了10個月的“封閉攻關”,“天河二號”高速互連通信系統性能得到提升,是當時國際商用互聯繫統的兩倍。它可以把上萬顆微處理器聯繫起來,共同解決同一個計算問題,解決了高效互聯中“微處理器越多效能越低”的世界難題。
一台超級電腦系統好比一個大城市,互聯通信系統就是城市的公路網,路由器就是立交橋,網路介面就是主幹道出入口。肖立權帶領項目組在校外進行了長達一年的封閉設計工作,自主研製出互聯通信系統最核心的兩塊晶片:路由器和網路介面。依靠自主創新,掌握了屬於自己的核心關鍵技術。這是“天河二號”在發展迅猛、競爭激烈的世界超算領域長時間保持領先地位的主要原因。“我們參加世界排名並不僅僅是為了第一。世界超算500強榜單其實是一個交流平臺,只有在國際上有了聲譽,別人才願意和我們交流。”肖立權深知,只有自立自強,掌握自主核心關鍵技術,才能在國際上掌握髮言權,讓世界聽到來自中國的聲音,讓中國更好地了解國際前沿發展趨勢。
眼下的這個暑假對肖立權和團隊來説,等於不存在。他正忙著帶領團隊全力投入新一代高性能電腦的研製攻關中,他的目標是摘取“超級電腦的下一頂皇冠”。