沙特創業者探訪嘉立創珠海生産基地,對中國智造點讚 | 打造數字風洞人才評價體系丨永信至誠2023年“春秋杯”網路安全聯賽冬季賽圓滿收官 | 破解科學數據要素化的開放共用難題 | 佳沛×百果園|「佳果好學屋」公益探訪微紀錄片發佈 | 2024年四千元客廳投影儀怎麼選?鐳射光源當貝X5亮度超高體驗極佳 | 2024少兒編程教育行業趨勢發佈,編程貓以頭部先發優勢引領行業發展 | 56城體驗報告:線上政務辦事品質需要精確提升 | 連收兩封國企感謝信,鋼銀電商SaaS服務再獲認可! | 中國文體投資運營控股集團與美國魔幻公司在中國大連旅順口區簽署戰略合作協議 | 創意無限 · 邁向未來 慶祝香港城大30年大學之旅 |
 
當前位置: 新聞>滾動>

破解科學數據要素化的開放共用難題

發佈時間:2024-01-23 14:56:18  |  來源:中國網科學  |  作者:陳旭 楊嘉帆  |  責任編輯:科學頻道

日前,國家數據局聯合17部門共同發佈的《“數據要素×”三年行動計劃(2024—2026年)》(簡稱“《行動計劃》”)為我國今後一段時期的數據賦能經濟社會發展指明瞭方向。面向科技創新,《行動計劃》提出要推動科學數據的有序開放共用,發揮科學數據的聚合價值。科學數據要素的放大、疊加、倍增作用的有效發揮有賴於開放共用機制建設、治理能力水準提升和基礎設施規模能級躍升。如何在確保科技、經濟與國家安全的前提下促進科學數據開放共用,形成科技創新和治理協同並進的經濟社會發展面貌,是推動科學數據要素化和價值化的“必答題”。

2018年國務院發佈的《科學數據管理辦法》明確了我國科學數據“開放為常態、不開放為例外”的原則,對科學數據的開放共用提出了要求和指導。目前,我國已經建設20余個不同學科、專業的國家科學數據中心,旨在依託國家科學數據中心等平臺強化高品質科學數據資源建設和場景應用、促進科學數據的開放共用。但還要看到,相關工作尚處於起步階段,科學數據開放共用不足,難以發揮《行動計劃》提出的科學數據要素乘數效應並促進科技創新生態,主要體現在以下幾個方面:

一是科學數據開放共用機制建設亟需完善。高校院所、企業科研機構及研究者團隊/個體主動開放共用研究數據的較少,現在匯交至國家科學數據中心的科學數據多來自政府預算資金支援開展的科研項目,屬強制匯交的範疇,數據來源單一、匱乏。成果搶發、敏感資訊、版權許可等障礙因素的存在,和學術認可度等激勵因素的缺失,導致科學數據開放共用動力不足,“重復性研究”和“一次性數據”形成強烈反差。

二是海量多源科學數據治理難題有待破解。不同學科、專業領域匯交的科學數據多源異構且規模龐大,導致大規模的跨數據源的數據整合、解析和統一訪問愈發睏難,應對海量數據存儲訪問高併發、高吞吐量和快速擴展的需求也對存儲系統提出了高要求。與此同時,數據品質、數據模型和數據語義的不一致性進一步增加了數據理解和數據管理的複雜性。

三是科學數據基礎設施服務效能仍需提質增效。現有的科學數據開放共用平臺僅起到數據倉的功能,未實現跨學科數據的有效利用,在“數據檢索、可視化、線上處理、結果記錄”等關鍵功能方面存在明顯不足。這些不足限制了平臺在支援高效開放科學實踐方面的能力。不同建設主體的科學數據基礎設施也分別存在用戶經濟和技術背景、平臺服務範圍、建設品質等多方面問題。

科學數據開放共用建設是科學數據要素化、價值化的重要前提和錨點,必須在機制、技術、生態和基礎設施建設等方面做好設計、加大投入,打造科學數據開放共用的範例並推廣相關經驗。為此,有以下三個方面需要重點突破,充分發揮科學數據要素的乘數價值:

一是加強科學數據確權溯源,打造科學數據多源共用機制。首先,構建科學數據確權溯源方案,同時利用區塊鏈等技術防止數據的篡改偽造,保障數據的流通透明;其次,建立科學數據的共用機制,通過引入智慧合約技術,明確定義科學數據的使用許可權,確保數據僅在合法授權的情況下被訪問、使用和共用;最後,制定科學數據共用激勵機制,將科學數據的引用情況納入學術評價體系,通過創建元數據(metadata)集、分配DOI,以及構建引用網路、通過可視化工具展示數據引用關係等方式,激勵各類科研社區更積極參與開放共用的科學數據文化。

二是以國際大科學計劃為牽引統一科學數據規範,優化國際國內生態。借助國際大科學計劃形成相關標準規範和共識,促使跨學科、跨國別的科學數據格式在一定程度上統一和互聯互通,增加數據的可互操作性,使其更易為其他科研團隊理解和使用。同時,在國際科學合作平臺上建立全球數據網際網路絡,實現各國和機構的科學數據便捷互聯,推動全球範圍內的科學研究協同。按照“開放為常態、不開放為例外“原則對數據進行有序開放,並由數據中心不定期地進行安全自查,發現可能涉密的數據及時下線處理。通過這些措施,有效推動科學數據的融合應用和復用率,為全球科研社區提供更為豐富和可靠的科學數據資源。

三是加快推進國家重大科技基礎設施、科學數據大科學裝置建設,夯實數據創新能力基礎。建設整合新型科研機構、科學數據中心、平臺以及計算服務平臺等為一體的具備先進數據採集、存儲、分析和模型構建能力的科學數據大科學裝置,使用者無需下載便可線上使用數據集和數據服務。統一由科學數據大科學裝置匯交和管理全國科研機構、高校和社會産生的科學數據,提供模型和算力服務,實現科學數據共用的範式轉變,使得未來科研人員可以在科學數據大科學裝置上實現數據採集、計算模擬、成果公開和科研過程記錄的全流程一體化、線上化、平臺化。

陳旭 之江實驗室數據樞紐與安全研究中心

楊嘉帆 之江實驗室標準化與智慧財産權服務中心