大數據的 前世今生
- 發佈時間:2014-12-11 01:30:51 來源:科技日報 責任編輯:羅伯特
“大數據(big data)”是什麼?要回答這個問題首先要看看數據是怎樣産生的。
在資訊化時代裏,我們每個人都在貢獻數據。上網、打電話、發短信、聽歌、拍照片、發帖子、看視頻,都會産生數據。就像涓涓細流匯聚成江河湖海,“大數據”出現了。
近年來,數據大爆炸的速度快得驚人,馬雲曾感慨地説:“大家還沒搞清PC的時候,移動網際網路來了,還沒搞清移動網際網路的時候,大數據時代來了。”
大數據時代來得太快,以至於人們對大數據的定義都有N多種。
按照美國國家標準與技術研究院(NIST)發佈的研究報告的定義:“大數據是用來描述在我們網路的、數字的、遍佈感測器的、資訊驅動的世界中呈現出數據氾濫的常用詞語。大量數據資源為解決以前不可能解決的問題帶來了可能性。”
按照業界權威高德納諮詢公司(Gartner)的定義:“大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資産。”
根據百度百科詞條的定義:“大數據,或稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。”
“大數據”到底有多大?目前通行説法,“大數據”至少要達到PB量級。其中,1PB=22.3萬張DVD光碟的容量,相當於800個人類大腦記憶總量,或90個人身體細胞數目總和。1PB的Mp3歌曲可以連續播放2000年。
美國網際網路數據中心指出,網際網路上的數據每年將增長50%,每兩年便將翻一番,而目前世界上90%以上的數據是最近幾年才産生的。全世界的工業設備、汽車、電錶等設備上有著無數的數位感測器,隨時測量和傳遞著有關位置、運動、震動、溫度、濕度乃至空氣中化學物質的變化,也産生著海量的數據資訊。
早在1980年,著名未來學家阿爾文·托夫勒便在《第三次浪潮》一書中,將大數據讚頌為“第三次浪潮的華彩樂章”。不過,大約從2009年開始,“163大數據”才成為網際網路資訊技術行業的流行詞彙。
如今,大數據技術可以幫助人們做很多以前做不到的事情。比如,國外某警察局利用大數據預測犯罪的發生幾率,可以精確到街區500平方英尺的範圍內,有針對性地預防,從而使該地區犯罪率明顯下降;某統計學家利用大數據預測總統選舉結果;某大學利用手機定位數據和交通數據建立城市規劃等。
大數據時代,海量的數據已經成為一種“礦藏”。據測算,3年前,2011年全球大數據産值51億美元;預計3年後,2017年全球大數據産值將達到534億美元。目前大量“掘金者”在數據的海洋裏挖掘、採集、提純、分析,從而得出有價值的資訊提供給政務的、商務的以及各個領域的買家,從而形成了大數據産業生態圈。
書同文,車同軌。任何新興産業要健康發展,首先要儘快建立大家共同遵守的標準。目前國內外大數據標準化工作已經起步。全國信標委已經對標準化工作進行梳理,從基礎、技術、産品、應用等不同角度及進行分析,形成了大數據標準體系框架,併發布了《大數據標準化白皮書》。
- 股票名稱 最新價 漲跌幅