以人工智慧(AI)為代表的新一輪科技革命和産業變革方興未艾。這樣一個時代,呼喚勇立技術潮頭的搏擊者,也一定能造就這樣的搏擊者。
作為首席科學家,張林峰是一個簡單純粹的人,一直執著攀登技術巔峰。作為深勢科技創始人,張林峰懷有技術人共有的一個夢想,去追尋科技的星辰大海,做一家源自中國、面向未來、引領世界的公司。
AI for Science是公認的發生在當下的科學革命,張林峰帶領著團隊,成為這場科學研究範式的踐行者。近日,記者走進位於中關村核心區的北京深勢科技有限公司,專訪公司創始人兼首席科學家張林峰。採訪中,他結合從事基礎研究的經歷,分享了AI技術的最新趨勢,以及AI對底層科研、對工業革新的推動作用。
AI加快基礎研究轉化效率
根基不牢,地動山搖。國家將基礎研究作為科技自立自強的根基,足見其重要性。
無論是在北京大學讀本科,還是在普林斯頓留學深造,張林峰所學的一直都是基礎研究中的基礎學科。十多年深鑽細研,張林峰不僅坐住了“冷板凳”,更洞察到了其中的新變化。
基礎研究是科學體系的源頭,它能變不確定性為確定性,變未知為已知。“基礎研究是一個國家核心競爭力所在。當下,國家需要的發展動力越來越指向基礎研究,指向原始創新。”張林峰認為,基礎研究的重要性毋庸置疑。
除了重要性,張林峰還發現,從原始創新到産業落地的效率和速度大大加快。“以前,如果説是30年的話,現在從原始創新到應用落地的這樣一個鏈條,在我們看來只需要3到5年。”
從原始創新到技術,再從産品到商業化,每個環節沒變,客觀規律也沒變,但時間為什麼大大縮短?
“這是因為整個轉化、流轉的效率變高了。在這個過程中,我們需要經常改變我們的視角,去做一個更加全局的所謂技術上的‘診斷’。”張林峰説,當技術的卡點存在於原始創新這一階段,一旦卡點被突破,下一個階段可能就直接進入商業化,而不是産品這環節。
一方面重要性提升,另一方面從開始到落地的週期變短。在這樣一個大背景下,基礎研究其實已經迎來極為重要的發展節點。
正因為整個科研生態已經變化,張林峰提出,“必須在全新的視角之下,去定義我們最該做的、屬於當下的事情”。在他看來,成立深勢科技,引領“AI for Science”發展,就是他和團隊當下最該做的事。
深勢科技自成立就致力於運用AI和分子模擬演算法,結合先進計算手段求解重要科學問題,為人類文明最基礎的生物醫藥、能源、材料和資訊科學與工程研究打造新一代微尺度工業設計和倣真平臺。
對科研人員來説,時間比金錢更寶貴。深勢科技就像是催化劑,幫助科研人員加速基礎研究進程。
“可能我們第一波造福的不是産業界的人,而是同樣面臨前沿發展驅動下的、一些更加追求創新研究的科學家、科研人。”張林峰説,過去這些科研人員在給定的技術條件之下做實驗、做理論模擬,但他們同樣也需要跟上時代革新的步伐,站在AI的肩膀上做科研創新。
底層科技突破的重構意義
2020年,張林峰的科研事業迎來高光時刻。
由他作為負責人帶領的團隊,憑藉新一代分子模擬方法研究成果獲得當年度具有“超算界諾貝爾獎”之稱的戈登·貝爾獎。該成果還與量子優越性、人造太陽等一起入選2020中國十大科技進展。
一直以來,人們都希望從第一性原理、從薛定諤方程這種最基本的規律出發,求解材料、藥物、化工等普遍關心的微觀世界的秘密。但由於演算法過於複雜,哪怕用超級電腦,也只能算幾十個、幾百個原子規模的體系,但一個蛋白,加上周圍的環境,至少幾萬、幾十萬個分子。換句話説,即便人類熟知微觀世界的基本規律,但微觀世界的複雜現象依舊無法用電腦模擬。
如何決定一款藥物或者材料的性能,是一個原則上可算但實際上因複雜度太高做不了的事情。這個難點,正是AI可以發揮作用的起點。
張林峰表示,微觀世界的數據通過AI學習,能夠讓AI掌握相應應用方向的物理規律。同時,AI也能做更大規模、更長時間尺度的計算,然後在高性能計算的優化下達到新的極致。
最終,項目團隊通過機器學習將分子動力學極限從基線提升到了1億原子的驚人數量,同時仍保證了從頭算的高精度,效率是之前人類基線水準的1000倍。這是第一次把AI和物理規律、物理方程以及高性能計算緊密的結合。
回溯過往,戈登·貝爾獎的評選一直鼓勵用最大規模的高性能算力去做最好的應用。張林峰團隊的項目之所以獲獎,其更大的意義就是能解決實際問題,並把相關行業的人才聚合到一起。
張林峰用“重構”這個關鍵詞定位這項獲獎成果的核心意義。“它更廣泛的影響在於學科的重構。其實所有這些行業已經因為AI和計算能力的提升被重構了。這樣的重構,也意味著人們的知識體系、協同模式以及複合學科的重組。”過去,數理化、電腦、生物醫藥和材料都是分散的學科,這些學科之下又分了很多類型,這些細分類型零散分佈于這些學科下設的三級目錄中。而基於AI的分子動力學模擬方法,將精確的物理建模帶入到更大尺度的材料模擬中,為打通力學、化學、材料、生物乃至工程學科,解決實際問題發揮出積極作用。
正如張林峰所言,基礎研究到應用落地的週期縮短,這與機器學習模擬上億原子這類重大科學突破密不可分。底層科技突破的意義,就在於可以催生出一系列新的創新。
比如,藥物研發難度大、投入高、風險大、週期長。張林峰以藥物研發舉例説,要破解其中的核心瓶頸,就需要進一步求解物理方程和分析大量數據的能力。受益於技術紅利,結合AI、物理模擬、倣真等一系列技術,能夠讓藥物從立項到臨床前的整個研發流程大大縮短。
這項能力是AI的這一波進展帶來的。在藥物、材料研發等更廣泛的領域,印證了張林峰談到的“從基礎研究到落地應用只需三五年時間”。
AI大模型的工業應用前景
近期,火熱的ChatGPT引發業內人士思考。事實上,超強算力、大模型技術並不新鮮,但能將這些技術發揮到極致,讓人覺得産品有用卻並不容易。
在張林峰看來,ChatGPT的産品形式非常巧妙,它在開發之初就在思考這種産品怎麼才能被用起來、以怎樣的技術形式規模化落地。“從原始創新一直到産品,到大規模落地,這麼大規模的一個原始技術突破的過程中,能夠做到這麼高的效率,其實非常值得大家思考。”
預訓練模型是推動AI應用的重要基礎設施,也是全球科技巨頭競相角逐的焦點。
與ChatGPT專注自然語言處理不同,去年年底,深勢科技、北京科學智慧研究院(AISI)以及項目合作者,聯合發佈了首個覆蓋元素週期表近70種元素的深度勢能原子間勢函數預訓練模型“DPA-1”。這一創新成果在模型覆蓋範圍、通用性、計算精度以及未來的AI生成等方面實現新突破,被視為AI for Science走向大規模應用的重要里程碑。
用過“DPA-1”的開發者們會發現,它就像是自然科學領域的GPT。根據需求,“DPA-1”像萬物之手一樣,能生成需要的物質組分和結構。它為什麼能夠做到呢?
此前,曾獲戈登·貝爾獎的創新解決方案,其實是基於量子力學生産數據,AI學習這些數據,學完後大規模模擬。如今,這個範式已經普及,量子力學生産的數據越來越多,多到已經幾乎要覆蓋整個元素週期表。這使得這樣一個領域也具備了走向預訓練模型的數據基礎。
“3年前,我們就想做這件事情,但是時機不成熟,原因是數據基礎不到位,現在做其實是最合適的。從社區生態上,從模型和數據的發展上,乃至從整個技術趨勢上來看,這樣的一個預訓練模型也是呼之欲出的。”張林峰曾説,“應該用全新視角定義當下該做的事情”,在他看來,這件事很顯然也屬於當下該做的事情。
在其他領域,GPT的迭代週期都比較長,但張林峰認為在分子模擬這個領域也許走得會更快,應用落地的深度也更深,這是他和團隊今年格外要解決的重點問題。
目前,科學計算的瓶頸在於演算法面臨“維度災難”的問題,即難以表示和難以有效地處理高位複雜的函數和大規模的複雜數據。幸運的是,AI有望助力解決科學計算中的“維度災難”,將不同尺度的物理模型有效連接起來。
AI向前發展有其自身規律。張林峰説,我們要做的就是借鑒AI的客觀發展規律,無論是技術側還是産業側的一系列發展特點,去反思我們的技術體系。
他舉例説,過去人們曾質疑AI落地的效果,其實把前人在不同應用場景的經驗整合起來,去“翻譯”好我們的場景,比如工業軟體這樣的場景,需要啟蒙。深勢科技兼具了翻譯者、啟蒙者以及最後從頂層創新到落地的角色。
生態協同打造工業軟體平臺
AI給基礎科研帶來機遇,除了凸顯基礎研究的重要性,也在改變從創新到落地的整個生態。
工業軟體被譽為“工業皇冠上的明珠”,過去一直是海外廠商佔據的領域。隨著AI時代的來臨,中國在AI領域也具有顯著的人才、數據、市場、應用等優勢。在AI時代,工業軟體也迎來新的開始。
張林峰認為,工業軟體容易被卡脖子關鍵不是軟體背後的原理,而是生態。它的背後需要底層演算法,規模化的軟體協同,以及軟體開發完之後,作為一個解決方案跟場景的落地迭代,以及反過來反哺創新。基於這樣的一個生態,持續迭代後,它才會越來越穩健。同時,工業軟體是工業智慧的結晶,必須要以工匠精神往深做。
對工業軟體平臺的創新,張林峰提示,要告別過去,用嶄新的思維去做。他説,單純演算法的突破、底層硬體的突破,往往會沉澱成過去的慣性,變成一種創新的歷史包袱,反倒難以升級。他以深勢科技開發的藥物設計軟體平臺為例,認為該平臺可能比已經成長了20多年的國外平臺更輕便,是因為深勢科技要做的不光是一種産品形態和技術形態的革新,而是依靠整個公司迭代的體系和不同研發人的角色配合,才能推動這種全新的工業軟體平臺的誕生。
深勢科技提出,專注于打造微觀尺度科學研究和工業研發的基礎設施。張林峰一直向研發人員強調,“軟體不是開發出來的,而是被用出來的,以需求和反饋為導向,持續優化才是工業軟體的真正壁壘。”
“沒摸過的東西,去想像我覺得不是很好。”張林峰説,為了發論文而發論文不是我們鼓勵的,基於對問題更好的定義來發論文是非常好的。
張林峰鼓勵公司研發人員自由探索,認為營造這種寬鬆的科研氛圍才能培育創新的土壤。其次,注重從定義問題到實現目標過程中的協同機制,要求大家既要自我驅動,也要觀點碰撞,然後再建立分工,營造一個共同贏球的團隊文化。同為科學家,他本人也一直跑在第一線,與做合金、做電池、做藥物研發的一線企業面對面交流,傾聽客戶的反饋。
從優秀變得卓越,意味著要樹立更長期、更樸實的價值追求。“我們從科學發展規律、從方方面面的認知,去定義未來長久的目標,然後在這個目標下,去倒推哪些是屬於公司當下該做的事情,然後持續演進。”張林峰説。
創新既是決定未來的關鍵變數所在,又是推動人類社會進步的核心動力。
深勢科技成立的初衷就是希望成為一家源自中國、面向未來、引領世界的公司。“未來幾年,可能是一個重構的週期,我們希望經歷這樣一個重構,在最後回頭來看時,我們是成功的。”張林峰也深信,如果公司能夠推動國內形成一個真正原始創新到落地應用的良好生態,能夠成就所有合作夥伴,那公司必然就是成功的。
展望未來,張林峰希望通過不斷商業化倒逼公司形成新的技術體系。他堅信,AI的能力還需要進一步喚醒,AI的應用也要深入到科學研究的更深處,能夠服務於能源、原材料等國家重大戰略需求,這是公司也是整個生態未來努力的方向指引。