駁《大數據時代》的三個觀點
- 發佈時間:2014-10-19 01:30:44 來源:科技日報 責任編輯:羅伯特
■觀點速遞
近年來,資訊化的步伐急劇推動著海量數據,波瀾壯闊的大數據浪潮席捲人類社會各個領域,一些通俗讀物囫圇吞棗的淺知誤見也隨之流傳。例如,當前國內常常援引維克多等人撰寫的《大數據時代》中提出的三個主要觀點,並成為一種流行。這不僅不能揭示大數據時代的真正本質,而且將産生嚴重誤導。
《大數據時代》提出,大數據時代“不是因果關係,而是相互關係”,這説明作者不了解因果關係本身也是一種相互關係。18世紀,英國懷疑論者休謨早就指出,“不但我們的理性不能幫助我們發現原因和結果的最終聯繫,而且經驗給我們指出它們的恒常結合以後,我們也不能憑自己的理性使自己相信,我們為什麼把那种經驗擴大到我們所曾觀察過那些特殊事物以外”。在休謨看來,“因果關係”不是自然的本質,而是因為我們所養成的心理習慣和人性所造成的。恩格斯從辯證唯物主義立場對此給與了批判性的揚棄,他指出,“原因和結果這兩個觀念,只有在應用於個別場合時才有其本來的意義,……”“要認識世界上一切過程的‘自己運動’、自生的發展和蓬勃的生活,就要把這些過程當做對立面的統一來認識”。《大數據時代》將休謨這一早已提出幾個世紀的陳舊觀點,作為大數據時代的新概念,不僅陳舊,而且錯誤。
《大數據時代》認為,大數據時代“不是隨機樣本而是全體數據”,認識事物不再是從隨機抽取的部分樣本,而是從全部數據出發。實際上,人類在有限的時間內不可能窮盡事物的全部。如果把現在的大數據方法和過去的小數據時代的抽樣調查方法相比,我們只能説,大數據時代可以用更為精確的、全面的數據,以包含更大因素的倣真模型來追蹤、分析模擬現實,取得比過去更為精確的認識結果。儘管如此,與全體相比,我們已經認識到的永遠是少數,誤差、錯誤還是不能完全消除。
《大數據時代》指出,大數據時代“不是精確性,而是混雜性”,其意指小數據時代講究精確性,大數據時代卻因為掌握了大量數據而不再拘泥于精確性,可以比較模糊地行動。這顯然是錯誤的。因為過去的方法雖然能夠掌握精確的小數據,但大多數數據卻會因處理能力有限而被遺漏、捨棄,認識的結果自然就無法實現精確、全面。在大數據時代,因為掌握了更為全面的數據,可以在更大的時間和空間範圍認識事物,因此能夠更為準確、量化,以至於對一些事物現象的中間模糊區域也可以得到更為準確的認識,其精確度和模糊度、誤差本身都更為精確量化。
我曾預言,“資訊化是上帝給中國崛起準備的禮物”,因為中國的人口數量世界第一,資訊産業市場最大,最有機會發展資訊化、大數據和智慧化産業。現在大數據迅速推廣,可喜可賀。但目前我國有一種極為嚴重的盲從國外的現象,盲目跟外國人之口風。我們千萬不要因盲從國外而將上帝送來的禮物又讓給別人!
摘編自《全球化》雜誌