當前位置：新聞>滾動>

AI真·煉丹：整整14天，無需人類參與

發佈時間：2024-07-02 11:20:40 | 來源：中國工業報社-中國工業新聞網 | 作者： | 責任編輯：科學頻道

現在制藥這事,人類要靠邊站了。

坐標蘇州,這是一個1600平的制藥實驗室,它的“打開方式”是這樣的:

門口,沒有人。

走廊,沒有人。

實驗室,也沒有人。

相比以往充斥著科學家、研究員的實驗室,它更多的是把機械臂和AI系統塞了進去,主打的就是一個全自動化。

或許好奇的小夥伴就要問,這樣的實驗室能幹嘛?就是為了自動化而自動化嘛?

事情當然沒有那麼簡單,你瞧見的只是無人的操作,但在背後,AI做的可遠遠不只是替代人工的實驗室操作那麼簡單,而是:

>14天內完成靶點發現和驗證,還是全自動化乾濕實驗閉環的那種。

要知道,這個過程要放以前,可是需要足足2-3年才能完成……

而且更為精細化的工作,例如樣本處理、細胞培養、化合物管理、高通量篩選、新一代測序、高內涵成像等等,不論是單一任務還是“聯動”任務,機器都可以在AI的控制下輕鬆接手。

用Echo 650T製備檢測板

用NovaSeq 6000測序

這便是來自全球AI制藥第一梯隊的“選手”——英矽智慧(Insilico Medicine)的第六代智慧機器人實驗室,也是全球首個用AI參與決策的生物學實驗室。

而在它背後驅動這一切的AI大腦,則是一個叫做PandaOmics的平臺,可以根據實驗的進程自主做決策、下達指令。

若是把這個AI平臺單拎出來,它更是囊括了20多種預測模型和生成生物學模型,還包含遺傳學、蛋白質組學、甲基化數據、文本文獻和科研基金等海量數據,用以支援專業的靶點識別、分析和排序、適應症探索等生物學研究。

甚至已經有高中生用PandaOmics發現了藥物新靶點,並且研究成果還登上了國際學術期刊!

而且除了PandaOmics之外,英矽智慧在人工智慧制藥領域擁有端到端的藥物發現平臺Pharma.AI,其中專注于化學領域的Chemistry42還可以針對給定靶點從頭設計具有特定屬性藥物理化性質的新型小分子。

這一切都可以在幾小時內到幾十小時內完成,且支援並行運作多個任務。

以及英矽智慧還將科技圈最潮的大模型也融入進來,在Pharma.AI的架構上推出Copilot系統,讓你只要會對話就能使用專業的AI制藥平臺。。

由此可見,現在AI不僅是把制藥這件事變成了“自動駕駛”模式,更是狠狠地把門檻打下去、效率提上來。

AI制藥的流程和工作是方便了,但隨之而來的一個問題便是:如此大的工作量,算力,又是如何解決的呢?

科學計算與AI,CPU都在發力

對於上述的問題,包括英矽智慧、晶泰科技等AI制藥的頭部力量們不約而同地選擇了相似的解決辦法:

充分利用所有可以用、值得用的科學計算與AI算力平臺。這種平臺可不是你想像的那樣被GPU制霸,相反,其中的CPU用量更大,尤其是英特爾的CPU。

為什麼要選擇英特爾?

首要的一個原因,就是英特爾供企業計算及科學計算使用的主力CPU,即至強®可擴展處理器系列産品,一直都是物理計算——無論是昔日電腦輔助制藥,還是今天AI輔助制藥都非常依賴的科學計算應用的關鍵承載平臺。

另一方面,就算是把應用的主題從相對傳統的制藥相關的科學計算任務,切換到更偏AI的應用上,英特爾也算是頗有建樹,這一點從它以AlphaFold2為代表的開源蛋白質預測模型的支援上就可見一斑。

AlphaFold2基本架構

首先,AlphaFold2整個端到端的處理過程,涉及⼤量複雜多樣的計算類型。從早期的數據收集、特徵提取等預處理階段,到基於深度學習的蛋白質結構預測,再到後續的結果分析,這是⼀個高度異構的工作負載。

而英特爾®至強®可擴展處理器可以輕鬆勝任這一系列多樣化的任務。以至強® CPU Max系列處理器為例,它採用全新微架構、更多內核(最高達56個),能以更高頻率和更大暫存,去應對⾼通量的預處理和後處理工作。

它在記憶體和輸入/輸出(I/O)子系統性能上有著顯著的增強,還結合大容量末級暫存使AlphaFold2推理過程中關鍵的張量吞吐獲得了大幅提升。

英特爾®至強® CPU Max系列處理器

其次,由於AlphaFold2所採用的深度學習模型規模巨大,推理過程中的張量運算不僅量大,且維度極高。這就要求承載平臺具備強⼤的AI運算加速能力。

在這⼀點上,新款至強®系列處理器內置的英特爾® AMX(⾼級矩陣擴展)技術,可以顯著加速大規模矩陣乘法運算。

在FP32/BF16混合精度計算下,其理論峰值可達每時鐘週期1024次乘加操作。針對AlphaFold2推理任務中所需的大量矩陣運算操作,AMX_BF16能在保持較高精度的同時,提高計算速度並減少存儲空間。

AMX_BF16推理優化帶來更低記憶體佔用和更大輸入長度

另一方面,AlphaFold2因其高維張量運算和長序列並行計算,在推理過程中常⾯臨超⼤記憶體需求,不光影響推理速度,還會限制更長蛋白質序列的預測。

為此英特爾從軟硬協同的方式給出完整解決方案。

一面是提升記憶體容量和頻寬。解決方案中,英特爾®至強® CPU Max系列處理器除支援DDR5記憶體外,還整合了HBM(⾼頻寬記憶體)。單顆處理器的HBM容量⾼達64GB,且具有高達460GB/s頻寬。

另一面是提供了多種降低記憶體的軟體優化方法。如面向PyTorch對張量計算原語(Tensor Processing Primitives,TPP)技術進行擴展,以及切分Attention模組和算子融合的推理優化方案,幫助AlphaFold2在通用矩陣乘法計算中所需的記憶體峰值大幅降低。

熱點算子與融合效果

經過一系列加強和優化後,最終效果如何呢?

如圖所示,在基於至強® CPU Max系列處理器的優化流程中,每個優化步驟獲得的提升累積後,獲得了相對於基線性能(對比組1,基於第三代至強®可擴展處理器,未實施優化)高達33.97倍的通量提升。

根據測算,性能提升中的74%源自預處理階段的高通量優化,26%要歸功於對推理過程的優化。

此外,在同樣開啟IPEX(面向PyTorch的英特爾®擴展優化框架)的情況下,相比對比組2(基於第三代至強®可擴展處理器,但實施過優化),方案在升級使用至強® CPU Max系列處理器後,其內置的HBM記憶體、英特爾® AMX的加成,則帶來了48.3%的性能提升。

切分Attention模組和算子融合的推理優化方案

而且值得一提的是,在一項基於某公有雲服務的測試中,基於至強® CPU平臺構建的AlphaFold2解決方案還在性能上獲得了遠優於某高端GPU平臺的表現,同時也優於由CPU+GPU混合構建的方案。

這可是一個非常難得的成績——畢竟過去在很多AI應用的測試或實戰中,CPU能有接近或媲美GPU的表現就已經算是成功,而AlphaFold2上至強®平臺則實現了性能+蛋白質預測序列長度的全面反超。

現在還剩下最後一個問題,多個蛋白結果的解析模型AlphaFold2 Multimer。

也就是從預測單個蛋白質三維結構,發展到了對多個蛋白質分子之間的相互作用及所形成的複合體結構進行預測。

CPU在這一演變過程中的支援力度如何呢?

答案是不用擔心!基於英特爾®架構的AlphaFold2解決方案同樣也面向AlphaFold2 Multimer的管線結構進行了優化與驗證,雖然後者的管線結構已根據蛋白質複合體結構預測的需求進行了調整,但英特爾AlphaFold2上的優化方案,在被用於AlphaFold2 Multimer時同樣有效。

面向AlphaFold2 Multimer模式的方案實現

CPU加速新藥發現不是夢

回顧以往,研發⼀種新藥動輒需要10年時間,投入20億美元才能起步。

而在AI的助力下,這⼀成本正大幅降低。以英矽智慧為例,它們進展最快的項目僅用18個月就找到了治療特發性肺纖維化(IPF)的潛在全球首創候選藥物並通過實驗驗證,總成本約為280萬美元。

展望未來,隨著AI技術的進⼀步發展滲透,它必將重塑制藥業的創新模式,讓新藥研發變得更加高效、精準、經濟。而在這⼀進程中,相關的科學計算及AI應用任務,依然需要有強大的算力支撐。

從英矽智慧、晶泰科技等實踐來看,以至強®處理器為代表的CPU平臺,正憑藉其在性能、成本、生態等方面的獨特優勢,成為推動AI時代制藥創新的重要“引擎”。

這也預示著,CPU加速AI應用落地,幫助用戶節支增效以及推進其技術和業務創新的腳步從未停止。

AI讓新藥研發進入“自動駕駛”模式,而英特爾®至強®處理器則提供了它所需的源源不斷的動⼒。

在這種合作模式下,AI+制藥還將擦出怎樣的火花,就很值得期待了。

為了科普CPU在AI推理新時代的玩法,量子位開設了《最“in”AI》專欄,將從技術科普、行業案例、實戰優化等多個角度全面解讀。

我們希望通過這個專欄,讓更多的人了解英特爾®架構CPU在AI推理加速,甚至是整個AI平臺或全流程加速上的實踐成果,重點就是如何更好地利用CPU來提升AI,包括大模型應用的性能和效率。

未來隨著英特爾AI産品技術組合的進一步擴展和豐富,我們還將在這裡為大家提供更多産品技術上的優秀用例與方案分享,以及技術應用指南。