智庫中國 >

【智庫思享】劉權：數據有用但應“爬取有道”

來源：法治日報｜作者：劉權｜時間：2021-06-02 ｜責編：申罡

文 | 劉權中央財經大學數字經濟與法治研究中心執行主任、法學院副教授

近日，北京市海澱區人民法院對新浪微網志訴字節跳動不正當競爭糾紛案作出判決。法院認為，字節跳動通過類似“複製粘貼”的方式，將新浪微網志內容大規模移植至今日頭條，擾亂了市場競爭秩序，構成不正當競爭。字節跳動需依法賠償新浪微網志經濟損失2000萬元及合理開支115.67萬元。此案再次引發了公眾對“網路爬蟲”合法性的關注。

所謂網路爬蟲，也稱網頁蜘蛛、網路機器人，是一種可以自動收集和整理網際網路上數據資訊的技術。在數字經濟時代，得數據者得天下。目前，數據已成為繼土地、勞動力、資本、技術之後的新關鍵生産要素。2019年，黨的十九屆四中全會首次提出，將數據作為生産要素參與收益分配。2020年中共中央、國務院發佈的《關於構建更加完善的要素市場化配置體制機制的意見》明確要求，“加快培育數據要素市場”。可以預見，未來的數據爭奪戰必將更加激烈，網路爬蟲糾紛必將更加普遍。而如何合理規範網路爬蟲，既有效保護數據主體的利益，又有力促進數據的高效流通利用，也是一個全球難題。

其實，網路爬蟲並非必然有害。正當爬取已公開的數據，符合互聯、互通、共用的網際網路精神，在某種程度上也有利於促進數據共用和數據流通利用，增加用戶福利。如百度、搜狗等搜索引擎的運作，實際上利用的就是網路爬蟲技術。通過網路爬蟲分享相關資訊，可以給用戶帶來極大的便利，甚至可以增進社會公共利益。

然而，如果長時間大量爬取數據，尤其是爬取具有競爭關係的經營者的數據，並對其商業模式進行實質性替代，就可能構成不正當競爭，甚至構成犯罪。如此前法院審理的“酷米客”訴“車來了”案，法院就認為被告利用網路爬蟲技術大量獲取並無償使用原告的實時公交資訊數據，實為一種“不勞而獲”“食人而肥”的行為，非法佔用了他人無形財産權益，破壞他人市場競爭優勢，違反了誠實信用原則，擾亂了競爭秩序，構成不正當競爭。

一般而言，在UGC（用戶生成內容）模式下，平臺對於用戶上傳的內容的確不享有智慧財産權，但如果放任其他平臺隨意大量爬取用戶上傳的內容，通過“搭便車”的方式，進行相同或相近的商業模式運營，那麼就會降低原來平臺的競爭優勢，損害其商業利益。而且，對於許多被爬取的數據，原平臺可能投入了大量的人力、物力、財力，即使這部分數據是公開呈現的，也不能被隨意爬取，否則就可能侵犯産權，而不僅僅是不正當競爭的問題。

數據有用但應“爬取有道”。網際網路企業在爬取數據時，應當遵守法律和商業道德，不得損害其他經營者或消費者的合法權益，不得擾亂公平競爭的市場秩序。

其一，大量爬取具有競爭關係經營者的數據應獲得合法授權。如果爬取的數據涉及用戶上傳的內容，則應獲得雙重授權，即“用戶授權”+“平臺授權”。即使爬取的完全是用戶上傳的合法文字、圖片、視頻等內容，也應獲得原來平臺的授權，因為這些內容可能涉及原來平臺的競爭權益。適度爬取不具有競爭關係經營者的數據，或許不需要獲得授權，以促進數據流通利用。

其二，即使是合法爬取數據，也不得超出授權範圍處理數據。使用數據應當與授權目的具有關聯性。如果用於明顯沒有關聯的其他目的，應當重新獲取授權。

其三，爬取的數據不得用於對競爭者的商業模式構成實質性替代的業務。如果大範圍使用被爬取的數據從事相同或相近的業務，那麼將導致具有競爭關係的經營者無法從市場競爭中獲得相應的回報和激勵，從而使其降低對相應産品和服務的研發與投入，最終會破壞公平競爭的市場秩序。

其四，不得爬取侵犯隱私權和個人資訊的數據。我國民法典明確規定自然人享有隱私權，任何組織或者個人不得以刺探、侵擾、洩露、公開等方式侵害他人的隱私權，同時還規定自然人的個人資訊受法律保護。如果爬取行為情節嚴重，還可能構成侵犯公民個人資訊罪、破壞電腦資訊系統罪，需要承擔刑事責任。

對於網路爬蟲行為需要進行有效規範，但不宜“一刀切”地簡單予以禁止。在進行立法制度設計時，應區分不同的數據爬取場景，充分運用比例原則、成本收益分析方法等進行利益衡量，實現權利保護和數字經濟發展的平衡。行政機關在執法時，需要貫徹包容審慎監管理念，對於沒有主觀惡意但造成客觀損害的數據爬取行為應予以適度寬容，以降低企業試錯成本而促進數字科技創新。

智庫中國 >

【智庫思享】劉權：數據有用但應“爬取有道”

來源：法治日報 ｜ 作者：劉權 ｜ 時間：2021-06-02 ｜ 責編：申罡

發表評論

來源：法治日報｜作者：劉權｜時間：2021-06-02 ｜責編：申罡