我國發佈首個億級參數量地震波大模型“諦聽”

7月28日,“諦聽”地震波大模型在四川成都發佈,該大模型由國家超級計算成都中心、中國地震局地球物理研究所以及清華大學聯合開發,是首個億級參數量的地震波大模型。

成都超算中心運營管理有限公司董事長郭黎介紹,2023年9月,國家超級計算成都中心與中國地震局地球物理研究所合作共建了“地震大模型創新應用聯合實驗室”,與清華大學、中國科學院地質與地球物理研究所合作啟動了“諦聽”地震波大模型的訓練。“諦聽”數據集是國內首個,也是目前國內外最大規模、樣本類型和標注最為全面的地震學專業AI訓練數據集之一,半年多時間裏,實驗室研究人員利用“諦聽”數據集獲得了首個億級參數量的地震波大模型。

“長期來看,地震學是一門觀測科學,重大突破往往來自對觀測數據的深刻理解。”中國地震局地球物理研究所副所長陳石介紹,目前,傳統方法和中小模型均無法充分利用百TB、千TB級別的地震觀測數據,而這些數據對地震學研究有重要意義,只有通過大模型才能深入挖掘。

“‘諦聽’大模型依託海量數據,通過先進的人工智慧技術,已經顯著提升了地震信號的識別準確率和速度。”陳石説。

國家超算成都中心常務副主任王建波介紹,“諦聽”地震波大模型對於突破中小地震波模型性能瓶頸,提高地震大數據智慧處理能力和資訊挖掘水準具有重要意義,國家超算成都中心正不斷加速人工智慧技術在防災減災、智慧城市等領域的應用與發展。據了解,目前“諦聽”地震波大模型已可投入使用,十億參數量級的版本預計2024年8月完成預訓練。未來,該大模型還可用於礦震監測、城市地下空間結構探測、海底地震監測等多個領域。

責任編輯:程雪