新聞源 財富源

2024年12月19日 星期四

財經 > 滾動新聞 > 正文

字號:  

吳甘沙:期待數據開放帶來真正的大數據時代

  • 發佈時間:2015-04-29 15:52:00  來源:中國廣播網  作者:佚名  責任編輯:羅伯特

  在英特爾中國研究院院長吳甘沙的微網志上,有一句英文的自我簡介,大致譯為“勇敢而與眾不同地思考大數據”。自2011年擔任英特爾中國研究院首席工程師以來,他一直主持研究院大數據方面的研究,工作重點為大數據記憶體分析與數據貨幣化。站在大數據思維和技術研發“潮頭”的他認為,研究大數據的樂趣在於“當大多數人在考慮第N個階段的時候,開始考慮N+1個階段”。

  當前,貴州也站在了大數據産業的“潮頭”。而環顧全球,大數據正以燎原之勢,從一個熱詞迅速轉化為科研院所、政府、企業、個人共同關注、研究、應用的對象,一種新的生産力正蓬勃興起。貴州、貴陽要引領發展趨勢,對話大數據專家,從他們那兒汲取智慧是一種事半功倍的途徑。為此,記者近日專訪了吳甘沙。

  大數據是指數社會的蛋白質

  “如果以世紀之交作為分隔線,上世紀的數據文化、思維和方法論還停留在前大數據時代,真正意義上的大數據思想本世紀初才破繭而出。”吳甘沙説。

  2001年,分析師道格·蘭尼提出大數據“大、雜、快”三大特徵,隨後詹姆斯·格雷將數據探索確立為科學研究中除了實驗、理論、模擬之後的第四範式,2008年後,《自然》、《經濟學人》、《科學》先後推出以大數據為主題的特刊。

  “這一系列思想大合唱終於在2012年使大數據成為顯學。”吳甘沙介紹,這一年,達沃斯的《大數據,大影響:全球發展的新可能》和奧巴馬政府的《大數據研發計劃》共同確立了大數據在世界範圍的戰略位置,而涂子沛《大數據》和舍恩伯格《大數據時代》在國內的出版,也使2012年被稱作中國的大數據元年。

  對於大數據,吳甘沙常常理解為:“摩爾定律是指數社會的基因,而大數據是指數社會的蛋白質。”上世紀60、70年代,英特爾創始人之一的戈登·摩爾提出:當價格不變時,積體電路上可容納的元器件的數目,約每隔18-24個月便會增加一倍,性能也將提升一倍。這一定律常常被用來形容資訊技術進步的速度。而吳甘沙認為,隨著移動互聯時代的到來,數據爆髮式增長在量上也越來越符合摩爾定律的指數遞增規律。

  “基因決定生命特徵,是初始點,而蛋白質是生命的物質基礎,是生命活動的主要承擔者,也就是説,大數據會越來越像原材料,像貨幣,變成社會生命活動的主要承擔者,關係到每一個人的數據化生存。”吳甘沙斷言。

  他進而舉例説,在大數據、雲計算移動網際網路物聯網等現代前沿資訊技術之中,大數據是根本和核心,雲計算是方式和手段,移動網際網路、物聯網則是物化大數據和雲計算價值的應用。

  大數據發揮作用的關鍵在於數據開放

  當下,“網際網路+”這一名詞及其對應的發展趨勢正方興未艾,而吳甘沙則提出了“大數據×”這一説法。他説,大數據與很多傳統産業融合在一起能夠産生乘法效應,不同産業之間融合還能産生數據外部效應,即一個産業的數據如果用於另外一個産業,它能夠迸發出巨大的價值。比如,金融數據跟電商數據碰撞在一起,就産生了像小微貸款那樣的網際網路金融;電信數據跟政府數據碰在一起,可以産生人口統計學方面的價值,幫助城市規劃人們居住、工作、娛樂的場所等等。

  而在吳甘沙的研究中,他越來越發現,乘法效應要充分發揮,必須走數據開放之路,讓不同領域的數據真正流動起來、融合起來。“最開始,大數據的主要矛盾是網際網路公司或線上數據太多的問題,接著,主要矛盾變成人沒有能力從數據中提取價值的問題,最後主要矛盾變成中小公司、傳統行業無法獲得數據,數據孤島的問題。”吳甘沙説,正因為如此,最近四五年,他個人的研究方向也從關注數據與機器的關係到關注數據與人,再到眼下關注數據與數據的關係。

  那麼,哪些數據適合開放呢?吳甘沙認為:“不涉及個體的公共數據和科研數據都可以開放,涉及個體的數據要明確數據權屬、隱私界定,獲得擁有者授權,採用技術匿名化之後再考慮開放。”他同時建議,可以借鑒英美,開放原始數據,而非提煉數據,保證數據滿足蒂姆·伯納斯-李提出的數據開放五星標準。

  目前,貴陽正通過寬頻貴陽和全域公共免費WiFi城市建設,推動社會企業和個人動態數據的“塊”上集聚。吳甘沙認為,WiFi採集數據的優點就是有數據發生所在地點的資訊,方便把數據放到不同的語境中分析。但他也堅持,在數據集聚之後,同樣需要明確獲得用戶對數據的授權。

  數據交易定價機制仍待實踐中摸索

  廣義的數據開放還包括數據的共用及交易。吳甘沙認為,無論是傳統企業還是網際網路企業,無論是製造業還是服務業都握有大量的數據,在大數據時代,如何讓數據變成政府決策、企業經營的第一要素,數據的交易顯得尤為關鍵。

  4月14日,貴陽大數據交易所完成了首批交易。在吳甘沙看來,數據交易所這樣一個基於市場進行價值發現和定價,連通大數據供需雙方,讓數據像股票交易那樣高頻率碰撞的交易市場,在大數據時代是大勢所趨。“數據的安全共用和交易是英特爾中國研究院在大數據方面著力的三個方面之一。”吳甘沙介紹。

  但他同時指出,無論是數據的交易,還是交易過程中數據的定價,現在都沒有標準的答案,“一來要從實踐中摸索,二來要有意識地跟經濟界做思想碰撞。”

  他舉例説,數據在公開市場交易的時候,是根據市場價值發現機制來定價,根據數據的種類來定價,還是根據數據訪問API的調用次數來定價?現在企業的資産中有一部分無形資産是數據資産,那麼這部分資産價值幾何?個人數據是否也需要定價,每個人的數字足跡,它能産生的價值是不是應該由個人自己來享受,而不是完全讓網際網路服務提供商從中獲益……

  儘管這些困惑尚無定論,但吳甘沙認為這也正是大數據的魅力所在。對於大數據,深耕多年的他認為,樂趣在於“當大多數人在考慮第N個階段的時候,開始考慮N+1個階段”。

  對於正在爭先發展大數據的貴陽,吳甘沙認為過去一年多的工作“非常棒!”,他同時給出了建議:要想在與北京等發達地區發展大數據的競爭中不落伍,人才聚集和可持續的供給非常關鍵。本報記者 姜曉琨

  更多大數據相關精彩內容,請關注【貴陽國際大數據産業博覽會暨全球大數據時代貴陽峰會·數據觀全程報道】http://www.gywb.cn/zhuanti/node_3842.htm

  掃碼知道更多

  

  

  想參加此次大數據博覽會的觀眾可以通過掃描下面的二維碼報名參與

  

大數據 詳細

漲幅榜 更多

排名 股票名稱 最新價 漲跌幅
1 紫光股份 80.14 10.01%
2 東軟集團 15.94 10.01%
3 賽為智慧 18.52 9.98%
4 航太資訊 27.13 7.28%
5 天源迪科 17.00 6.25%

跌幅榜 更多

排名 股票名稱 最新價 漲跌幅
1 天夏智慧 12.58 -5.77%
2 上海鋼聯 74.30 -3.19%
3 美的集團 52.84 -3.10%
4 南威軟體 12.10 -2.97%
5 奧飛數據 75.28 -2.87%

熱圖一覽

高清圖集賞析

  • 股票名稱 最新價 漲跌幅