安華金和—可信數據空間助力公共數據授權運營安全有序開展的實踐探索

發佈時間:2024-07-04 16:54:06 | 來源:東方網 | 作者: | 責任編輯:喬沐

伴隨數字化、網路化和智慧化的快速發展,數字經濟與實體經濟深度融合,數據已然成為經濟發展賴以依託的基礎性、戰略性資源,對社會生産、分配、流通、消費和社會服務管理等各環節産生深刻影響。我國高度重視數字經濟發展,將數據列入繼土地、勞動力、資本、技術之後新的重要生産要素,是數字經濟發展的核心引擎,而數據流通能夠打破數據孤島,促進數據在不同主體之間的共用和交換,從而更大地釋放數據的潛在價值,推動數據從資源化向資産化、價值化的重大變革。

基於公共數據體量大、種類多、覆蓋面廣、價值潛力大、政府主導型強等特點,作為數據要素的核心組成部分,通過對公共數據的授權運營,可以將這些數據資源轉化為有價值的數據資産,對提升公共治理水準和促進産業發展具有重大推動作用;同時,將公共數據運營樹立為數據要素市場發展的排頭兵,對促進數據要素流通深入發展起著重要的探索和示範作用。

鋻於公共數據的易複製、可傳播、非排他性等特性,流通過程中的數據安全風險也日趨突出,導致不敢共用、不願共用,制約著公共數據的有效流通和價值釋放。本文旨在研究和探索公共數據授權運營過程中的安全技術保障體系,解決公共數據運營過程中的數據安全問題,促進公共數據要素流通的健康、有序發展。

國家戰略與地方政策背景

2021年,《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》(簡稱“十四五”規劃)中提出,開展政府數據授權運營試點,鼓勵第三方深化對公共數據的挖掘利用,從頂層政策佈局與關注的視角,明確提出了關於公共數據授權運營的戰略規劃。這一戰略是在我國將數據要素確定為新型生産要素並參與分配的背景下提出的,旨在通過盤活公共數據要素資源,釋放公共數據的價值,確立了促進公共數據授權運營發展的基本導向。同年,國務院辦公廳印發《要素市場化配置綜合改革試點總體方案》,提出要探索“原始數據不出域、數據可用不可見”的交易範式,探索開展政府數據授權運營,從安全合規要求與技術實現路徑的視角,提出了個人隱私與公共安全保障的原則。

2022年,《中共中央國務院關於構建數據基礎制度更好發揮數據要素作用的意見》(簡稱“數據二十條”)進一步提出推進實施公共數據確權授權機制,明確統籌發展和安全,貫徹總體國家安全觀,強化數據安全保障體系建設,把安全貫穿數據供給、流通、使用全過程,劃定監管底線和紅線。2023年,國家數據局圍繞公共數據授權運營,在《“數據要素×”三年行動計劃(2024—2026年)》中,提出加大公共數據資源供給,在重點領域、相關區域組織開展公共數據授權運營,探索部省協同的公共數據授權機制,通過提升數據供給水準、優化數據流通環境、加強數據安全保障等措施,推動數據要素與勞動力、資本等要素的協同作用。

在國家數據要素系列政策文件指導和推動下,全國各地多個省市開展了數據流通與交易方面的先行先試、探索實踐,如貴州作為全國首個大數據綜合試驗區,建立了全國最早的貴陽大數據交易所,在全國率先探索數據流通交易價值和交易模式並持續進行數據要素交易流通模式的探索實踐;北京出臺《北京市數字經濟促進條例》,對數據開放共用、數據交易與市場化流通做出規定,針對公共數據流通,提出設立公共數據專區,以建設公共數據開放創新基地等方式,促進數據資源的創新應用;上海出臺《上海市數據條例》,對公共數據和個人數據的流轉、開放、共用等做出規定,成立了上海大數據交易所,並率先提出數商的概念;廣東出臺《廣東省數據要素市場化配置改革行動方案》,首創數據經紀人作為全省數據要素市場化配置改革的一項制度性安排,旨在鼓勵設立社會性數據經紀機構,規範開展數據要素市場流通仲介服務;深圳出臺《深圳經濟特區數據條例》,對個人數據、公共數據、數據要素市場、數據安全等方面做出規定;浙江出臺《浙江省公共數據授權運營管理辦法(試行)》,提出按照“原始數據不出域、數據可用不可見”的要求,在保護個人資訊、商業秘密、保密商務資訊和確保公共安全的前提下,向社會提供數據産品和服務”的總體原則,明確數據安全責任與安全管理要求。

公共數據及公共數據授權運營的定義

GB/T 43697-2024《數據安全技術數據分類分級規則》將公共數據定義為“各級政務部門、具有公共管理和服務職能的組織及其技術支撐單位,在依法履行公共事務管理職責或提供公共服務過程中收集、産生的數據。”

公共數據授權運營,是指“縣級以上政府按程式依法授權法人或者非法人組織(以下簡稱授權運營單位),對授權的公共數據進行加工處理,開發形成數據産品和服務,並向社會提供的行為”。(源自《浙江省公共數據授權運營管理辦法(試行)》)

公共數據授權運營參與主體

公共數據授權運營涉及到多個參與主體、多個運營環節的運營生態。其中涉及的參與主體包括:

1)數據資源供給方:數據持有方,保證所提供的數據源合法合規,發佈公共數據資源到平臺上,供第三方開發利用。

2)數據産品開發方:對公共數據資源進行開發利用,産生數據産品,發佈數據産品,與消費者形成數據産品消費合約,也稱數商。

3)數據産品消費方:對數據産品進行使用以提升自身的業務或服務能力,願意為數據産品的使用付費。

4)數據運營方:政府批准授權經營的數據運營第三方,提供公共數據運營平臺,供各方發佈數據資源,開發、發佈和消費數據産品;提供可信數據空間基礎設施,供各方開展數據安全協同運算與數據安全流通;對授權運營全過程進行集中管控。

5)運營監管方:根據國家法律法規、行業規範對公共數據授權運營全過程實施監管,在監管方需要時,平臺提供介面配合監管方監督、管理、調查。

典型公共數據授權運營流程

基於數據持有權、加工使用權、産品經營權的數據産權分置,圍繞公共數據授權運營涉及各參與主體,構建從本地數據資源主題發佈,到數據産品開發、産品發佈、産品消費與應用,及貫穿全過程的運營與監管流程,並通過供需匹配、運營評價,實現全閉環協同生態圈。

典型的公共數據授權運營業務流程

公共數據授權運營面臨風險與安全需求

面向公共授權運營全流程環節,從數據資源供給側、數據産品開發側到數據産品消費與使用側多個角度分析面臨的主要數據安全風險:

數據資源供給側的安全風險

1)數據洩露風險:在數據資源供給過程中,如果安全措施不到位,可能導致公共數據資源被非法獲取或洩露。

2)數據篡改風險:在數據資源供給過程中,數據可能被非法篡改或偽造,導致數據失去真實性和可信度。這可能對政府決策、市場分析和公眾利益産生負面影響。

3)數據所有權風險:公共數據的所有權屬於政府或公眾,但在授權運營過程中,如果權責不明確或管理不善,可能導致數據被濫用或侵犯他人權益。

數據産品開發側的安全風險

1)供應鏈安全風險:在數據開發過程中,如果供應鏈中的某個環節存在安全隱患,如數據開發方被惡意攻擊或內部人員洩露數據等,都可能對公共數據的安全構成威脅。

2)技術安全風險:在數據開發過程中,如果採用的技術手段存在安全隱患或漏洞,可能導致數據被非法獲取或篡改。此外,開發過程中的代碼漏洞和配置錯誤也可能導致安全風險。

3)數據品質風險:如果公共數據存在數據一致性、完整性、關聯性等問題,也可能存在因數據品質問題而導致的數據産品計算結果偏離和誤導的風險。

數據産品消費與應用的安全風險

1)數據濫用風險:在數據産品消費與應用過程中,如果用戶對數據進行不當使用或傳播,可能導致數據洩露或侵犯他人隱私;此外,一些不法分子可能利用數據進行非法活動,如詐騙、洗錢等。

2)數據抵賴風險:在數據産品消費過程中,如果沒有對數據交易過程進行有效存證,可能導致對交易和結算過程不認可,産生交易糾紛風險。

數據安全需求

打造安全可信的公共數據要素流通環境,有效規避授權運營過程中的數據安全風險,解決公共數據面臨的“不敢共用、不願共用”的問題,確保“數據資源可信發佈,數據計算安全流通,數據産品安全使用”,支撐保障公共數據“供得出,流得動,用得好”。

公共數據授權運營安全治理的框架思路

設計原則

1)安全與業務融合:

通過對生態角色在各環節的角色分置、流程管控,實現公共數據權屬確定、利益分配、安全保護的合理、合規性。

安全性與便利性兼顧:

基於原始數據不出域,可用不可見,合理選擇數據樣本脫敏、隱私計算、介面安全訪問等安全技術在各環節的應用,實現公共數據流通便利性與安全保護的平衡。

3)差異化分級管控:

充分考慮公共數據運營的應用場景需求,該管的管住,該放的放開。根據數據的安全等級要求,以及使用者身份及使用場景不同,落實差異化的防護與監測措施,有效促進數據開發利用。

總體設計思路

面向各授權運營參與主體,圍繞授權運營全流程,構建分佈式可信數據空間基礎設施,基於數據分類分級,建立安全可信通道,實現各方節點的安全可信接入、授權訪問、加密傳輸、安全防護與審計、存證溯源,確保原始數據不出域、分級標簽和脫敏樣本可出域,數據流通可算、可管、可計量,實現各方節點的域內和跨域流通安全保障。

安全設計思路

*注:可信數據空間是數據要素流通體系的技術保障,通過在現有資訊網路上搭建數據集聚、共用、流通和應用的分佈式關鍵基礎設施,以體系化的技術安排確保所簽訂的數據流通協議能夠履行和維護,解決數據要素提供方、使用方、服務方、監管方等主體間的安全與信任問題。(源自國內首個可信數據空間標準《可信數據空間系統測試規範》)

總體安全框架

基於IPDR經典安全架構,面向域內數據流轉內迴圈與跨域流通外迴圈,授權運營總體安全架構覆蓋數據識別與分類分級(I)、場景化數據安全防護(P)、全流程數據安全監測(D)、數據安全應急響應處置(R)四個方面:

基於可信數據空間的總體安全框架

1)數據識別與分類分級:包括對數據資源和數據産品兩類對象的分類分級及確權授權。

2)場景化數據安全防護:圍繞數據資源發佈、數據産品開發與發佈、數據産品消費與應用環節,從域內流轉和跨域流通兩個維度,構築體系化的數據安全防護技術措施。

3)全流程數據安全監測:通過日誌存證、全鏈路流量監測等手段對數據流通全過程操作行為進行全面監測,及時發現違規操作行為並進行預警。

4)數據安全應急響應處置:建立事件分級響應預案,按照事件級別進行及時的應急響應與處置。

安全部署架構示意

整體授權運營可信數據空間的部署架構以分佈式形式進行部署,具體劃分為:

數據資源安全發佈節點:部署在各數據資源提供方的數據資源發佈節點,保護數據資源發佈過程中安全可信。

數據産品安全開發節點:部署在各數據開發方的數據産品開發節點,保護數據開發過程中可算不可見。

數據安全中心管理節點:部署在授權運營方的授權運營中心控制節點,對跨主體的安全計算進行調度和管理,對整體數據安全進行集中監測與管控。

數據産品消費方訪問終端與數據監管方的監管終端:實現對消費方和監管方終端訪問的可信接入與安全訪問。

部署架構示意

安華金和公共數據授權運營解決方案概述

數據分類分級

對原始靜態的數據資源與加工、開發形成的數據産品進行數據識別與分類分級。在實踐探索中,公共數據分類按照公共數據業務屬性可劃分為三類:個人資訊、企業資訊與社會公共資訊;數據分級可按照公開程度劃分為三級:無條件開放,受限開放與不予開放;進一步,基於分類分級實現對數據資源使用和數據産品消費的授權確權和安全策略設定,其中授權確權包括基於分類分級的數據樣本管理、數據産品開發過程中的數據資源授權使用以及數據産品應用的授權調用。

數據資源與數據産品的分類分級

數據資源提供安全

圍繞數據資源提供涉及的域內、跨域各個數據處理活動,為保障數據資源提供過程的安全性,重點需落實如下數據安全技術措施:

數據資源提供過程與數據安全防護措施

數據資源提供節點域內安全防護措施:

1)分類分級處理:依據公開數據分類分級標準,對擬發佈的數據資源進行數據分類分級標識,並基於數據分類分級結果,設定數據資源使用的分類分級確權規則。

2)數據加密:基於數據分類分級,對高級別的數據落實數據存儲加密處理。

3)數據脫敏:在數據抽取過程中,對採集獲取的原始數據視場景和級別進行必要的數據脫敏處理。

4)身份認證與訪問控制:針對採集匯聚的數據訪問和治理,進行身份認證與細粒度的訪問控制。

5)品質檢測:對採集匯聚的原始數據集,基於元數據標準,針對其完整性、一致性、關聯性進行品質檢測,確保數據品質。

6)操作審計:對提供過程的操作行為進行審計,並留存日誌。

數據資源提供節點跨域安全防護措施:

1)可信接入:對數據資源提供分佈式節點進行可信接入認證,確保節點接入授權運營平臺的來源可信。

2)資源訪問的確權合約:針對數據開放方對數據資源的訪問,基於區塊鏈和智慧合約,確保數據資源使用的不可抵賴存證。

3)脫敏樣本發佈:在主題發佈過程中,通過脫敏措施,對發佈的高級別樣本數據進行必要的脫敏處理。在脫敏處理時,要考慮脫敏規則的一致性,以保障樣本脫敏後的可關聯性。

4)隱私計算支援:構建分佈式數據安全沙箱,支援多方安全計算、橫/縱向聯邦學習等隱私計算協議,落實原始數據不出域,可算不可見。

5)傳輸鏈路加密:對數據提供節點與開發節點、中心節點間的數據傳輸通道進行鏈路加密,防止中間人劫持等攻擊風險。

6)跨域流通行為審計:對數據資源提供側的跨域數據流通行為進行審計,以支援全過程數據流轉監測與追蹤溯源。

數據産品開發安全

圍繞數據産品開發涉及的域內、跨域各個數據處理活動,為保障數據産品開發過程的安全性,重點需落實如下數據安全技術措施:

數據産品開發過程與數據安全防護措施

數據産品開發節點域內安全防護措施:

1)樣本數據與正式數據保護:針對開發節點自身攜帶、參與開發的正式數據與從授權運營平台下載的樣本數據,基於數據資源分類分級標記,實施相應的身份認證與訪問控制、數據加密、數據脫敏、安全審計等通用防護措施。

2)樣本數據品質檢測:數據樣本是落實數據聯合開發、建模工作的重要基礎,通過對數據樣本的完整性、一致性、關聯性檢測,支撐數據産品開發的準確性、有效性。

3)演算法檢測:對數據産品開發涉及的演算法的安全性、合法合規性進行安全檢測,確保演算法、模型安全合規,避免數據洩露和不當使用。

4)分類分級處理:依據公開數據分類分級標準,對擬發佈的數據産品進行數據分類分級標識,並基於數據分類分級結果,設定數據産品使用的分類分級確權規則。

數據産品開發節點跨域安全防護措施:

1)可信接入:對數據産品開發分佈式節點進行可信接入認證,確保節點接入授權運營平臺的來源可信。

2)隱私計算支援:構建分佈式數據安全沙箱,支援多方安全計算、橫/縱向聯邦學習等隱私計算協議,落實原始數據不出域,可算不可見。

3)數據脫敏:通過數據脫敏處理措施,對數據産品結果集中涉及的高級別敏感數據進行必要的脫敏處理,避免數據洩露。

4)傳輸鏈路加密:對數據開發節點與數據提供節點、中心節點間的數據傳輸通道進行鏈路加密,防止中間人劫持等攻擊風險。

5)跨域流通行為審計:對數據産品開發側的跨域數據流通過程進行行為審計,以支援全過程數據流轉監測與追蹤溯源。

6)産品消費確權合約:針對數據産品消費方對數據産品的訪問,基於區塊鏈和智慧合約,確保數據産品使用的不可抵賴存證。

數據産品消費安全

數據産品部署上架與産品應用調用,無論是數據集還是預測模型,一般都是以API的形式被調用的,為保障數據産品調用的安全性,重點需落實圍繞API的數據安全技術措施:

數據産品消費過程與數據安全防護措施

1)傳輸鏈路加密:通過建立HTTPS,VPN專線等手段,確保API調用的通信時通過加密的安全通道進行的。

2)身份認證與訪問控制:通過API key等對API調用進行身份認證,並通過黑白名單、分類分級鑒權等措施實現對API調用的訪問控制。

3)行為審計:實時監測並記錄API的訪問行為,識別API調用過程中敏感資訊情況。

4)數據浮水印:在API結果集中嵌入數據浮水印,以對API中的結果集的數據使用行為進行跟蹤溯源。

5)合法正當性檢測:在API調用過程中,通過與隱私政策約定的授權處理目的、處理範圍進行一致性檢測,對存在超範圍使用的違規事件及時預警並阻斷。

數據安全集中監測與預警

對數據資源發佈、數據産品開發及發佈、數據産品消費、數據運營保障的全過程行為進行集中監測,發現違規行為及時預警干預,重點需落實如下數據安全技術措施:

1)日誌存證:對資源發佈行為、産品開發行為、産品消費行為、運營保障管理行為落實全面的日誌操作存證。

2)全鏈路審計:結合操作日誌與流量分析,刻畫公共數據流通全鏈路審計視圖。

3)監測預警:基於全鏈路監測,及時發現違規安全事件,並及時預警。

應急響應處置與跟蹤溯源

對識別發現的各個級別的數據安全事件進行應急響應處置與事件跟蹤溯源。重點需落實如下數據安全技術措施:

1)應急響應處置:制定安全事件應急預案,發生安全事件時立即啟動應急預案,實施處置、控制事態、消除隱患、組織研判、保存證據並及時向相關部門報送資訊。

2)事件跟蹤溯源:對産生的安全事件進行跟蹤溯源,分析事件源頭與成因。

數據安全合規監管

向公共數據授權運營監管方實時呈現授權運營全過程的數據流通情況與數據安全合規態勢,並按監管要求定期輸出數據安全合規報告。

公共數據授權運營作為數據要素流通的一種創新模式,目前授權運營模式本身還處於探索階段,鋻於公共數據授權運營涉及多個利益相關者,如何協調各方利益、確保數據的安全使用必然也是一個需要結合實踐應用持續研究和創新的過程。

伴隨公共數據授權運營探索的日益深入、法律法規和政策標準的持續健全、創新安全技術和方法的不斷涌現和實踐,公共數據授權運營安全治理的思路和方法將不斷走向體系化、落地化。安華金和堅持技術創新,積極助力公共數據授權運營深入、持續發展,為推動數據要素高效合規有序流通,為數字經濟的繁榮貢獻力量!

查看網址