數據過度解讀就是濫用數據
- 發佈時間:2015-09-27 09:41:00 來源:南方日報 責任編輯:羅伯特
南方日報訊 (記者/吳少敏 實習生/廖冰瑩 通訊員/李夢影)26日,全球第一本關於大數據的著作《大數據時代》的作者、被譽為“大數據時代的預言家”、“大數據之父”的牛津大學教授維克托·邁爾·舍恩伯格受邀做客中山大學“黃埔大講堂”,開講“大數據能做什麼”。他表示,在解釋數據的過程中要非常小心,如果解釋得過度了,實際上就是濫用數據。
舍恩伯格現任牛津大學網路學院網際網路治理與監管專業教授。他説,美國航空業在行銷、旅客體驗等領域,仍然有大量的需求沒有得到滿足,這其中也就蘊含了大數據技術應用的大量機會。近年,谷歌公司購買了美國航空業的大量數據,試圖通過將數據與移動整合到一起,了解客戶的需求,為航空公司構建一個有用的差旅助手。其中美國政府規定,谷歌公司即使購買了數據也不能對其進行壟斷,其他方也有權使用這些數據。政府應當在數據壟斷的問題中擔當起重要角色,以此來實現更加公平、合理地使用大數據技術。
他警惕地分析説,在解釋數據的過程中要非常小心,如果解釋得過度了,實際上就是濫用數據。比如在美國做汽車分析,顯示橙色車維修的成本是最低的。“大家可能在想,為什麼橙色的車維修率低?是因為橙色的車夜晚看得更清楚?還是開車的人更小心?”在數據分析的過程中,“要找的是相關關係,而不是因果關係。”
舍恩伯格總結説,人類要通過數據去進行學習,進行創新,但是也要想有時候可能數據本身跟現實是有一定距離的。所以,人類可能對於現實了解不多,還有很多要學習,要堅信大數據是最重要的。