中國網首頁 網上直播 大會直播文字實錄圖片實錄返回直播頁

分論壇:大數據論壇

  第三屆世界網際網路大會于2016年11月16日至18日在浙江烏鎮舉辦,本屆大會的主題是“創新驅動造福人類——攜手共建網路空間命運共同體”。大數據分論壇定於2016年11月17日14:30在浙江烏鎮會展中心舉行。中國網現場直播,敬請關注!文字實錄 圖片實錄 返回直播頁

直播摘要

圖片實錄 更多

相關新聞

相關專題

相關站點

活動標題

  • 分論壇:大數據論壇

活動描述

  • 第三屆世界網際網路大會于2016年11月16日至18日在浙江烏鎮舉辦,本屆大會的主題是“創新驅動造福人類——攜手共建網路空間命運共同體”。大數據分論壇定於2016年11月17日14:30在浙江烏鎮會展中心舉行。中國網現場直播,敬請關注!

文字內容:

  • 中國網:

    由中國國家網際網路信息辦公室和浙江省人民政府聯合主辦的第三屆“世界網際網路大會·烏鎮峰會”2016年11月在浙江省烏鎮舉行。中國科學院主辦的大數據論壇從大數據技術發展展望、大數據安全風險防控、大數據産業發展與行業應用角度策劃,邀請專家研討。

    2016-11-17 14:37:56

  • 主持人 高春東:

    尊敬的各位專家、各位來賓、各位朋友,女士們、先生們,大家下午好!歡迎大家來到美麗的烏鎮,參加第三屆世界網際網路大會大數據論壇。我是中國科學院辦公廳副主任高春東,很榮幸由我擔任本次論壇的主持人。

    2016-11-17 14:56:12

  • 主持人 高春東:

    大數據論壇是第三屆世界網際網路大會“網際網路創新”專題的重要組成部分,也是首次由中國科學院主辦的世界網際網路大會專題活動。本次論壇由中國國家網際網路信息辦公室和浙江省人民政府指導支援,中國科學院主辦,中科學院資訊工程研究所承辦,數據中心聯盟協辦。

    2016-11-17 14:56:55

  • 主持人 高春東:

    本次論壇邀請了國內外著名專家、學者和企業家,圍繞“大數據的發展與安全”這一主題,從大數據技術發展展望、大數據安全風險及防控、大數據産業發展與行業應用三個角度,進行廣泛和深入的研討。相信本次論壇對大數據技術和産業發展將有一定的促進作用。

    2016-11-17 14:57:09

  • 主持人 高春東:

    出席本次論壇的嘉賓有:圖靈獎得主、卡內基梅隆大學雷伊·雷蒂教授;澳大利亞科學院院士、工程院院士、墨爾本大學饒·寇他科裏教授;中國工程院院士、中國科學院計算技術研究所倪光南研究員;中國科學院院士、中國科學技術大學常務副校長潘建偉教授;中國工程院院士、中國銀聯股份有限公司執行副總裁柴洪峰研究員;中國通用技術研究院學術委員會主任黃殿中先生;浙江省委常委王新海先生;中國科學院秘書長鄧麥村研究員;另外,還有來自國內外學術界和企業界的嘉賓朋友們。首先,請中國科學院秘書長鄧麥村先生致辭。大家歡迎!

    2016-11-17 14:57:25

  • 鄧麥村:

    尊敬的各位專家、各位來賓、各位朋友,女士們、先生們,大家下午好!歡迎大家來到歷史悠久、粉墻黛瓦的浙江烏鎮,參加第三屆世界網際網路大會大數據論壇。在這裡,請允許我代表本次論壇的主辦單位中國科學院,向遠道而來的各位嘉賓、各位朋友表示熱烈的歡迎!向論壇的指導支援單位中國國家網際網路信息辦公室以及浙江省人民政府表示衷心的感謝!

    2016-11-17 14:57:35

  • 鄧麥村:

    當前,以資訊技術為代表的新一輪科技革命方興未艾,資訊技術與經濟社會發展深度交匯融合,數據迅猛增長成為重要的基礎性戰略資源。大數據正日益對全球生産、流通、分配、消費活動以及經濟運作機制、社會生活方式和國家治理能力産生重要而深遠的影響。如何突破大數據關鍵技術,如何運用大數據推動經濟發展、完善社會治理,如何在推動大數據發展的同時確保資訊安全,已成為世界各國和各行各業普遍關注的熱點問題。本次論壇以“大數據的發展與安全”為主題開展研討,就是希望能對相關領域的技術和産業發展有所促進。

    2016-11-17 14:57:54

  • 鄧麥村:

    中國科學院作為中國自然科學最高學術機構、科學技術最高諮詢機構和自然科學與高技術綜合研究發展中心,按照國家經濟社會發展和科技創新總體部署要求,秉承“三個面向、四個率先”的辦院方針,一直重視大數據基礎研究和技術攻關,以及科學大數據的開發利用。鄧麥村:在大數據前沿技術研發與應用方面,為應對終端接入規模、海量數據處理性能、能耗和安全等四大挑戰,中國科學院于2012年啟動了“面向感知中國的新一代資訊技術研究”戰略性先導科技專項,組織二十多個研究所的科研力量協同攻關,現已形成以人工智慧晶片“寒武紀”、代數處理器晶片、深度可編程網路、三元融合安全技術、海雲大數據系統等為代表的一系列原創性成果,在智慧城市、社會治理等領域得到了成功應用。

    2016-11-17 14:58:04

  • 鄧麥村:

    在可信大數據技術、大數據安全通信、大數據訪問控制、身份認證授權等大數據關鍵技術上,以及量子通信技術上已取得重要突破,成為國家大數據安全領域的中堅力量。同時,在數字地球、全球變化、高能物理、基因組計劃、深空探測等領域,利用大數據技術驅動科技創新,也取得了一些重要成果。

    2016-11-17 14:58:14

  • 鄧麥村:

    在科學大數據積累與應用方面,上世紀70年代,中國科學院就開始建設專業數據庫。經過幾十年的持續部署和推動,中國科學院現已建成服務全國科技界的“中國科學院數據雲”,整合了各學科領域的1340個數據庫資源,共用數據達655TB,年均線上訪問超過千萬人次。此外,中國科學院的網路安全工作也得到了行業主管部門和業界同仁的肯定。

    2016-11-17 14:58:24

  • 鄧麥村:

    按照《中國科學院率先行動計劃》和《“十三五”發展規劃綱要》,未來一段時間,中國科學院將在大數據領域加強相關基礎科學問題研究和軟硬體關鍵技術開發,繼續引領國家科學大數據建設,為國家大數據發展和大數據安全保障體系建設作出應有貢獻。

    2016-11-17 14:59:42

  • 鄧麥村:

    借此機會,我願向大家提三點倡議:第一,推進大數據基礎研究和技術攻關。大數據的快速發展提出了許多新的科學問題,仍有很多關鍵技術亟待突破。我們應深入開展數據科學研究,在大數據理論、方法及關鍵應用技術等方面進行探索,不斷提升數據分析處理能力、知識發現能力和輔助決策能力,形成安全可靠的大數據體系。

    2016-11-17 14:59:51

  • 鄧麥村:

    第二,加強大數據專業人才培養。發展大數據,人才是關鍵。大數據的快速發展對專業人才提出了非常急迫的需求。我們應創新人才培養模式,建立健全多層次、多類型的大數據人才培養體系,重點培養專業化數據工程師等大數據專業人才,大力培養具有統計分析、電腦技術、經濟管理等多學科知識的跨接複合型人才,積極培育大數據技術和應用創新型人才,注重培養網路資訊安全專業人才。

    2016-11-17 15:00:01

  • 鄧麥村:

    同時,還應依託社會化教育資源,廣泛開展大數據知識普及和教育培訓,不斷提高社會整體的認知和應用水準。

    2016-11-17 15:00:13

  • 鄧麥村:

    第三,深化大數據國際合作交流。大數據的快速發展給世界各國都帶來了共同的機遇和挑戰。我們應堅持平等合作、互利共贏的原則,建立完善國際合作機制,積極推進大數據技術的交流與合作,充分利用國際創新資源,共同促進大數據相關技術和産業發展。

    2016-11-17 15:02:33

  • 鄧麥村:

    中國科學院願意同國內外同行和社會各界朋友一起,在新一代資訊技術和服務業態蓬勃發展的浪潮下,共同為大數據發展與安全貢獻力量!最後,再一次對國內外同行和社會各界對中國科學院科技創新工作的支援表示衷心的感謝!

    2016-11-17 15:02:44

  • 主持人 高春東:

    感謝鄧麥村秘書長的致辭,接下來請圖靈獎得主、卡耐基梅壟大學機器人研究院創始院長雷伊·雷蒂教授,以“人工智慧和大數據服務社會”發表主旨演講,大家歡迎。

    2016-11-17 15:02:54

  • 雷伊·雷蒂:

    大家下午好!我今天下午發言的題目是“社會服務中網路驅動的人工智慧和大數據應用”,這一屆的世界網際網路大會的主題考慮進去之後,我其實把我的題目已經變長了,原來沒有那麼長,就變成了“社會服務中的網路驅動的人工智慧和大數據應用”。

    2016-11-17 15:15:22

  • 雷伊·雷蒂:

    也就是説未來社會的發展,會有更多的大數據、AI方面的應用。但是如果我們沒有高速的網路,所有的一切都是白搭。而高速的網路,如果我們沒有電腦能力的指數級的增長,又是不可能實現的。每十年我們就會有100倍的增長,在過去的50年當中,我們應該是100的五次方,以這樣的數級每年在增長,所以你想100的五次方,是怎樣一種指數級的增長?

    2016-11-17 15:22:12

  • 雷伊·雷蒂:

    不是説我兩倍三倍還是百分之多少,而是指數級的增長。所以我今天想跟大家説,如果沒有這樣的增長,我們就不可能實現所有網際網路的一切。

    2016-11-17 15:22:22

  • 雷伊·雷蒂:

    我要跟大家分享的不光是説企業的精英、社會的精英,而是世界上的每一個人給我們帶來網際網路領域的機會。我會給大家講一些大概的主題,首先很大的一個主題就是網際網路,網際網路已經有50歲了。阿帕網路誕生於1968年左右,1977年的虛擬網路,網際網路誕生於1977年左右,網際網路50年來飛速的發展,主要歸功於什麼呢?

    2016-11-17 15:23:23

  • 雷伊·雷蒂:

    就是它的指數級的增長數據處理效率記憶體頻寬都指數級的增長,高速的網際網路推動了人工智慧、機器學習、大數據分析的發展,催生了各種各樣的服務。而所有的技術和大數據的發展,讓我們可能去做金字塔底端的低層人群都能使用的全社會性的數字應用。

    2016-11-17 15:23:33

  • 雷伊·雷蒂:

    接下來跟大家講一下30年來計算效率、計算能力增長了數以百萬倍,就是指數級的增長。在過去的30年當中,計算效率增長了數以百萬倍,這些增長源於每一個個人電腦,每一個工作站,微型電腦。我們期盼未來30年有新的重大的突破,讓每一個人都擁有頻寬、記憶體、計算效率的變化,而且花費比一杯咖啡還低的費用。

    2016-11-17 15:23:43

  • 雷伊·雷蒂:

    這張圖給大家看一下電腦的增長,從1900尤其到四十年代之後,到現在的2011年,其實是我們人類領域計算能力增長的一個急劇上升的階段,我們看百萬級的增長是什麼意思呢?計算效率也以百萬級別的增長,另外要給大家看一下硬碟的容量的變化,比如説我1972年我可能要花一百美元才能買到40G的儲存容量,現在你買一個40G的容量,是不是100美金都不需要?

    2016-11-17 15:24:05

  • 雷伊·雷蒂:

    就是百萬美金到一百美金這樣的變化,每15個月硬碟的容量就會翻倍,光纖革命甚至每天都在發生。也就是説每一個人,比如説每一個手機以後有1T的容量很快我覺得是沒有問題的。我們每光纖以後可以達到怎樣的數量呢?

    2016-11-17 15:24:18

  • 雷伊·雷蒂:

    100、200、250的頻寬已經非常的讓人驚訝了,而且在接下來的五年、十年、二十年當中,增加的速度會更加的快,更加的驚人。大家要做好準備,所有的公司所有的企業都要準備好這一切,我給你100G的速度,你做什麼?

    2016-11-17 15:24:50

  • 雷伊·雷蒂:

    給大家看看我們有了大數據,有了人工智慧深度學習的突破,可以做什麼?它可以催生金字塔底層人群使用的新的應用程式,這個非常非常重要。我們看一下金字塔,在過去的30年當中計算的效率增長那麼快,讓底層的人群有可能使用新的應用程式。世界上大家都沒有意識到有這麼多的人,其實是屬於底層。有30億的日收入低於2.5美金金字塔底端的人群,他們幾乎是半文盲,不能閱讀寫作,也不能讀寫任何的語言,不會使用鍵盤,不會使用觸屏電腦,如果是半文盲,溝通的唯一途徑如果是講話的話,你沒有鍵盤,沒有觸屏,什麼東西都沒有。

    2016-11-17 15:25:01

  • 雷伊·雷蒂:

    你想像一下,溝通通過什麼途徑呢?你跟同事怎麼溝通?當然是説話、講話。我們未來跟電腦也要進行這樣子的互動,非常直接的你就像對待一個人一樣,對待你的電腦,你不需要去觸屏,不需要打鍵盤跟它互動,你的電腦就像一個人一樣,就是一個人,你跟它進行類似于對人一樣的互動,這是一個電子人。你想,電子人它不是人,如果你要能夠讀懂一個電腦的話,你現在需要一個很受教育的人,而未來如果它是一個電子人一樣,就像一個真正的人,有一樣功能的話,世界上所有的人民都可以使用電腦了,這就是人類巨大的一個進步,可能在中國網路的普及率還是非常高的,但是大家要記住,世界上還有很多很多人,是沒有使用電腦,是買不起日常生活用品的。他們還在貧困線下掙扎,你想每天生活的水準低於1美金的話,這樣的人怎麼可能去買電腦呢?

    2016-11-17 15:37:20

  • 雷伊·雷蒂:

    30億人是什麼樣一個概念?他們每一個人只要花一美金的話,那就是30億的容量。所以我今天的話題就是語音處理。網際網路通過人工智慧和大數據應用能夠幫助30億金字塔底端的人民。雲處理到底可以做什麼呢?我們連接之後,有了網際網路可以做什麼?可以娛樂,可以網上購物,網上購物是文盲的人很好的一個電腦應用,他們用的東西,如果他們想要,但價格很高,那就買不到。但是如果網路購物對他們來説變成現實的話,那你就有了一個萬億的新市場。但是他們沒法讀寫。你要記住,他們怎麼上亞馬遜、上淘寶去買東西或看所有的資訊呢?這裡就是我們可以進行革命的地方了。我不用去亞馬遜,比如説我有錢,我看不懂字,沒關係,我讓我的助理去買一樣東西,去任何地方買一個東西,但是如果我們的電腦可以實現這一點的話,我不需要我的助理一個人去做這樣的事情,我可以讓我的電腦作為一個電子人去幫我變現這樣的事情,甚至可以在全球的範圍內進行購物。

    2016-11-17 15:37:42

  • 雷伊·雷蒂:

    如果技術可以在他們平民身上進行應用的話,甚至説英語這件事情,比如我在這兒説英語,機器可以幫你翻譯成中文,而且用非常簡潔的英語告訴你是什麼意思,在2012年的時候已經實現了英漢互譯技術,但是實時進行筆譯,已經實現了。但是還有沒實現的是什麼呢?就是我們有很多很多的孤語,非常小的語種,可能一百萬人講這個語言的人口都不到,所以説是非常小眾的人。這個事情現在還沒有做,這個市場現在還是空白的,如果我們可以實現語音到語音的翻譯,比如説從定語的語言翻譯成本地的語言,這會給你提供很大的市場。

    2016-11-17 15:38:02

  • 雷伊·雷蒂:

    沒有一個公司能為研發小語種應用投入大量的資金,我們需要做什麼呢?我們不可能比如説很小很小的語言,比如説廣東話、上海話,本地的方言,你要去識別,是非常重要的,現在還沒有人做。這一點完全是可以實現的,如果我們有了這樣一個技術,我們要做語言的研發和翻譯,那麼可以一起來做,我們最重要實現的是不需要觸摸鍵盤,不需要電腦觸屏就可以實現,我們就要考慮到政府的合作,很多底層人民的需求。下一個案例跟大家講的資訊是叫認知增強器和安全護衛天使,因為因特網帶來人工智慧和大數據的應用,這裡面比如説可以非常的智慧,並且保護你。這個就是我們説過的數據,現在慢慢的收集起來就應該利用起來造福社會。比如説你可以根據天氣的原因,或者你睡眠的原因,睡眠的深度來決定你的手機要不要叫醒你等等,我們希望這些應用可以深入到我們的日常生活。

    2016-11-17 15:38:16

  • 雷伊·雷蒂:

    這裡我舉兩個例子,一個叫認知增強器,什麼意思呢?比如説我們到銀行説我要付帳單,那你去銀行付了帳單,這是你必須要做的這件事情。但是我的意思是説,如果你在家裏,網上做這件事情,你想我沒有時間去銀行,你就叫你的助理去做這件事情,那麼如果以後的認知增強器就像這麼一個小助理的話,你必須要做這件事情,在一定的時間內。你必須要完成,你就可以讓你的電腦去完成你本來可以做但沒有時間去做的事情。

    2016-11-17 15:38:30

  • 雷伊·雷蒂:

    我本來想給大家講一下架構的問題,很多程式是具有學習能力的,學習能力哪來呢?來自大數據,手機的大數據,這些大數據不是給我用,而是給每一個人所有的大眾都可以用。比如説亞馬遜,你要去買一個電腦來看。那麼有一些比如説底層人民我還不知道怎麼樣在網上付這個帳單,如果你不需要這麼一個交易的過程就可以完成帳單的支付,你需要叫一個人支付,這是一個未來的增長潛能。如果機器有學習能力,你就不需要讓程式員再去寫一個新的程式,而是機器可以跟你直接進行互動。因為它有學習的能力,這個就叫深度學習,這個是我們未來發展的方向。

    2016-11-17 15:38:41

  • 雷伊·雷蒂:

    未來幾十年我們相信會有新的重大的要素突破,帶來計算效率的有幾萬倍的增長,從而使相同成本情況下效率達到更高,相同成本情況下成本變得更低。個人的數據已經被政府和企業收集在安全的範圍內將數據進行分析即刻義得到合理的分析,尋找他們的規律通過糾錯進行學習,通過闡述來學習。每個人都能獲益於語音人工智慧的助手深度學習機器學習是我們未來的趨勢。就像你的助理在你身邊學習你做的事情,並且幫你代理一樣,機器未來就可以通過計算大數據來做這些事情。謝謝。

    2016-11-17 15:38:53

  • 主持人 高春東:

    謝謝雷伊·雷蒂教授,讓我們再一次用熱烈地掌聲對雷伊·雷蒂教授精彩演講表示感謝。接下來有請中國工程院院士、中國科學院計算技術研究所研究員倪光南先生,以“大數據在電子政務中的應用實踐”為主題演講。大家歡迎!

    2016-11-17 15:39:06

  • 倪光南:

    大數據很多人説大數據是財富,這裡我們説把它作為生産力,生産力肯定能夠産生財富,但是生産力是不是比財富更合適?因為一些經濟學家告訴我們,生産力是最基本的,生産力決定生産關係,至少有一些經濟學家是這麼説的,今天的理論是這麼説的。所以我們把大數據作為生産力,可能比大數據作為一種財富更好、更全面一點。我們強調大數據生産力,會推動生産關係的發展,推動社會的發展,當然會創造無窮無盡的財富,供大家參考,我們喜歡説把大數據作為生産力,進入大數據時代意味著進入了一個新的生産驅動時代,所以將來對於我們整個思維的發展將會造成很大的變革。

    2016-11-17 15:39:19

  • 倪光南:

    大數據的四種能力,或者説大數據的四個價值。第一個是融合Fusion。當然包含了整合,整合意味著數據的物理上的聚集,量的聚集。這裡更加強調的質的變化,當而數據匯聚起來融合以後,它的價值會更加提升,遠遠比原始數據簡單的算術相加要多。所以我們用了融合的意思,在中文上融合可能把它理解成匯聚加融合,就是數量和品質的提升,是大數據給我們提供的能力或者提供的價值。

    2016-11-17 15:39:36

  • 倪光南:

    第二,雲計算Cloud。當大數據達到這樣大的量的時候,你要迅速的利用它,在我們需要的時候隨時能夠利用,傳統計算架構已經不適用了。這時候應用的是Cloud而雲計算,雲計算提供這種能力,對於大數據相適應的,雲計算是為大數據而生的,或者説大數據和雲計算相輔相成,兩者之間互相推動,應該説互相促進,是一個非常典型的例子。

    2016-11-17 15:39:47

  • 倪光南:

    第三,Insight,意思是我們可以説明察秋毫,當你有了大數據,世界萬物的關係你可以分析出來,很多人説我們不在意什麼因果關係,我們在意的是關係。誰和誰能夠夠相關性,不管怎麼樣,我們有了大數據,直到世界萬物之間可以發生過去沒有想像到的,過去我們在商業上面啤酒和藥物之間發生關係了,現在我們大數據會結合一些新的規律,人類可以發現一些新的規律、新的原理或者新的科學的創造。毫無疑問,通過理論分析,通過電腦到大數據,這是萬物之間關係的方式。

    2016-11-17 15:40:03

  • 倪光南:

    第四,預見性。Foresight大數據給我們一種預示性,可以更進一步。我們預測到將來什麼時候會發生什麼事情,非常有可能發生一些什麼事件的預測,可以通過語境分析可以預測時間上的推進。這四個要求、四個價值、四個能力是大數據給我們的,以前是沒有的,對我們非常有意義,對政府做科學治理體系的建設非常有價值。

    2016-11-17 15:40:17

  • 倪光南:

    政府利用大數據來做資訊建設,這裡是用一個部委,某一個部委,可能有相當類似,從頂層到中央政府到地方一直到基層,一個部委的資訊化的建設,作為一個中央的部委,他將會命令一個什麼要求,達到什麼目的,大致上有相當的普遍性。底層我們要對待的是什麼呢?四大塊。第一塊毫無疑問,大量的數據,你將要面臨的一個部委的數據,我們知道比如説中國從地方來講,應該有200多個地級市,2800個縣鎮鄉,我們相信中國部委的資訊化大數據系統難度要比目前世界上任何國家的資訊系統或者電子政務系統更難。

    2016-11-17 15:40:27

  • 倪光南:

    第二,我們是一個異構,因為與歷史的關係,我們不可能在現在作為一個新的系統,我們是要整合歷史上的資訊系統。這些數據,這些資訊系統可能是不同時期做的,不同公司的,很多公司的,所以你發現異構是相當清楚的,是完全不同的異構系統,你要把它融合起來,是一個很大的挑戰。

    2016-11-17 15:42:15

  • 倪光南:

    第三,應該是部門上的保護,各個部門之間很難融合。此外還有地級,毫無疑問,東南西北不同的地區差別都很大,而且地理位置的差異,這是我們面臨的挑戰。我們要做一個電子政務大數據,我們未來要達到什麼目的呢?根據三個需求,我們要把它匯聚起來、整合起來、融合起來,就是剛才説的意思,我們要把這些資訊大數據資源融合起來;日常工作。審計、監管,政府部門要做這些事情,我們大數據是用來支撐當前工作,使它更有效地完成得更好;這可能以前做不到,現在可以做到,如果大數據我們可以有科學決策。一個政策將會産生什麼效果?應該可以預測,可以看到這是可行還是不可行,包括怎麼改進。這是對於政府的科學決策,給予科學的工具來支援。所以我想大概無非是這幾個地方比較重要,我們分別來講這三塊。

    2016-11-17 15:42:51

  • 倪光南:

    第一塊融合是很難的地方,當你要建造一個資訊系統,你不能把政府工作停下來,因為資訊化你能説我這個部門關掉,等我兩年以後做好了再開嗎?不可能。每天還要繼續工作,不可停頓。第一業務是不可以停頓的,資訊系統必須在保證正常工作情況下進行,所以這是採用什麼對策呢?其實我們要把數據的獲取的手段用一種很巧妙的方式,在它運作的時候,我能抓取它,不是停下來我把它拷貝下,把政府的數據庫清理出來把數據拿過來不行。政府照常工作,在政府運營的工作中誰去抓取數據,這套辦法就是這個例子,具體操作上大家知道怎麼做數據庫,不斷地提取,不影響你正常工作,這是第一個挑戰。

    2016-11-17 15:44:19

  • 倪光南:

    第二塊,所有的政府部門是遍佈全國的,這個比較簡單,實際上採用的在中國的網路,也是有幾家運營商,我們要談合作一起做,並行的做。這個基本上可以想像代價多一點,此外比較難的,我們知道數據結構,就是因為歷史上這些數據都不是一次建的,不同廠家,不同規格這個是很難的。比如説面臨的數據,我們知道你可能是不同的結構,你的數據庫不同廠商,你的資源定義是不一樣的,你的數據模型是不一樣的。所以當你要用一個數據的時候,你會發現在這個數據庫要用,用這些方法收集組合,但另外一個又是完全不同的。這裡提出了智慧的數據切片,實際上用一種相當於影射,沒有一個地方我投影投到一個地方,不同的數據庫投到另外的投影,最終效果一樣,最終是新的辦法解決。最後我們的數據我們知道並不是很好的,有的數據很多垃圾,不是很合理的,你需要用一些很靈活的模型,各種演化的方法不斷的改進。

    2016-11-17 15:49:12

  • 倪光南:

    我們看到最後的效果,用這樣的方式我們支撐了1700個伺服器,遍于全國的1700個伺服器支撐這個系統。大量的數據在200個城市裏能夠有3個PB的數據,但是我覺得大概一年無非增加1是個PB,不斷增加,而且大概覆蓋到98%,還是相當大的覆蓋。應該説是一個足夠大的規模,這是目前的效果。

    2016-11-17 15:49:24

  • 倪光南:

    剛才講未來滿足監管審計的要求,相對來説比那個簡單一點,我們知道原來上報數據,就是給領導上報,比如一星期我們知道每個部門不一樣,一週也有,半個月也有,一個月也有。現在來講就可以自動實時上報,不需要報表,實時的可以從系統裏抓取你的數據。過去政策性很難保證,現在沒有問題。以前你很難知道它變化,現在是實時數據,這點沒有問題,現在可以有許可權地分配,更加合理的應用,這個大家可以想像,有這樣的數據資訊系統以後對於資訊監管毫無疑問有很大的影響。

    2016-11-17 15:49:36

  • 倪光南:

    達到的效果這裡講的10秒,可以在10秒鐘把任何的數據提取出來,這對於管理來講有很大的效果。此外我們知道所有的歷史變化你也可以得到。而且我們知道許可權可以明確地分配,就是誰可以獲取哪些數據,這個是很重要的,不同的許可權可以看到不同的結果。包括系統管理應該是看不到重要的數據,這個是需要有很好的許可權分配,這是效果,這是當前管理效果。最後是我們對預測的效果。過去這種資訊系統是大數據系統所做不到的,我們希望未來要實現過去資訊孤島的問題,現在我們已經通過融合的手段可以把數據統一起來,使整個的許可權數據可以互聯互通,另外我們過去來講歷史數據不一定有,今後的歷史數據應該永遠發展下去,永遠保留下去。過去有一些東西會刪掉,現在這些會不斷地積累下來。此外,過去的數據會滯後,現在可以動態的實時分享,業務也可以聯繫起來,綜合業務決策不是單路的決策。謝謝大家。

    2016-11-17 15:49:50

  • 主持人 高春東:

    謝謝倪光南院士,我們再一次用掌聲對倪光南院士精彩的演講表示感謝。接下來有請澳大利亞科學院院士、工程院院士,墨爾本大學終身教授饒·寇他科裏先生,以“大數據分析的前沿技術”為主題進行演講,大家歡迎!

    2016-11-17 15:50:03

  • 饒·寇他科裏:

    首先我來講一下籠統的概念就是深度學習以及它的應用,什麼是最先進的深度學習,那就是用最先進水準的技術可以非常穩定的來採取數據來實現人工智慧來解決一些人工智慧的問題。比如説進行自然語言的加工,李世石已經被谷歌的AlphaGo打敗了,它就成為世界上最厲害的圍棋手,這個是非常典型的深度學習的典型象徵。我相信在未來的幾年過程當中,我們就可以用系統來進一步的開發,我們都知道谷歌的Alphago它是怎麼樣的一個神經網路呢?

    2016-11-17 15:50:15

  • 饒·寇他科裏:

    這個是他們背後的邏輯,也就是説我們理解背後的邏輯以及語言的網路,最後可以用在我們的其他的成功案例過程當中。這個就是我們所使用的最典型的一個架構,這個架構看到了一些圖片的處理,語言的處理、語音的處理等等,還要基於問題處理其他的東西,不光是圖片、語音,我們需要有識別,我還是給大家看一些挑戰,我們有什麼樣的挑戰呢?我們叫把它叫做ILSVRC,就是説一個圖片,它在大規模大範圍視覺認知的時候,會遇到各種各樣的挑戰,比如説你看到這個圖片,你去攝影它的時候需要對象識別,這個圖片到底是告訴你這是一隻鳥還是一隻青蛙,這個地方就會有難度,所以你需要有對象的定位,所以這就涉及到對象的識別和定位,這個圖片也是。到底是一個人一條狗還是一個椅子?這個就是電腦識別的基準,我們遇到大規模視覺識別的挑戰。大規模視覺識別挑戰,還有這樣一個統計的數據,就是最難的五個圖像處理,ImageNet方面的五大錯誤,這個錯誤率當然是一年比一年降低,而且降低的速度也是非常非常快。

    2016-11-17 15:57:11

  • 饒·寇他科裏:

    到2014年,我們基本上已經把錯誤率降到很低很低的,到了2015年,現在電腦已經跟人眼所識別到的東西水準是完全一樣的,這就是我們神經語言網路可以幫我們做到的水準。當然人類還需要更多的東西,比如説圖像字幕的抓取,這也是我們想做的一件事情。

    2016-11-17 15:58:11

  • 饒·寇他科裏:

    另外一個案例很有意思,兩個圖片,比如説下面一個,你給他下面一個圖片,然後機器會給你一張很漂亮的圖片,就是右邊的這個。另外一個機器學習的案例呢,就是你給它兩張,一張照片,一個花圖,最後出來一個非常漂亮的圖片。其他的也一樣,這也是我喜歡的圖片,馬和麵條結合出來這麼有藝術感的圖像。這個就是我們了解的神經語言網路,最後出來了這麼一個特徵圖,也就是説它會把這些圖片的特徵都有機的,或者用藝術的感覺把它連接在一起。

    2016-11-17 15:58:23

  • 饒·寇他科裏:

    這個就是深度學習的應用,包括電腦的視覺,包括標注、電腦、無人駕駛汽車這裡面都是需要用到電腦視覺,比如説你把我的名字輸進去以後,給你各種各樣我的圖片以及我這個人涉及在一起的各種各樣的圖片。自然語音加工是深度學習應用的另外一個案例,然後是現場翻譯,我覺得現場翻譯亞馬遜翻譯等等,以後都是可以實現的,包括大城市的數據,車輛的數據等等。

    2016-11-17 15:58:36

  • 饒·寇他科裏:

    接下來,給大家講一下對抗性樣本和無法識別的樣本。神經網路易受的干擾就是對抗性的噪音干擾。比如説這裡面有123456789,如果你加進去一些肉眼看不到的聲音進去以後,最後一模一樣的圖片出來的數據,就變成了6332931這樣的,完全不一樣的數據。其實這個數據還是123456789,也就是説有一些聲音,雖然我們人是完全感知不到的聲音,而這些聲音輸入到機器當中,電腦會非常非常的敏感,會干擾它對圖像的識別。這個就是機器所敏感的噪音,另外我們還做了一個隨機大容量噪音,隨機大容量噪音不是非常細微,而且大家都一樣,在每一個數據上面都加入了大容量的隨機噪音,出來的結果影響並不是很大,只有一個數據錯了。

    2016-11-17 15:58:50

  • 饒·寇他科裏:

    再比如説,我們看所有的圖片,大家看這個圖片,它會識別出來的時候都是蘑菇,如果加了噪音以後,識別出來的結果會不一樣,所以聲音對圖形的識別是很有意思。我們加入過程當中,我們怎麼樣去做對抗性的干擾,對抗性的聲音?對抗性的聲音我們用的是分類器,我們用不同的每一次識別的時候,我們都輸入X,它的向量也會不一樣,對抗性和概率也是不一樣的。

    2016-11-17 15:59:20

  • 饒·寇他科裏:

    最後這個問題,是通過梯度下降實現噪音的對抗性干擾。對抗性干擾,樣本的屬性應該是非常特別的,剛才我説到的普遍性,就是需要用這樣的分類器和基本的線性模型和良好的訓練。它的概括性和普遍性是可以通過我們的干擾來實現的。不管你做什麼,他們都必須要非常得小心,我們要有很多很多的技術,這個比較專業。比如説基本資訊模型,良好的訓練分類器等等,抵抗力方面,我們需要正規化,需要降噪建築,需要對抗性的訓練,還有同時發聲、共振等等。還要進行一定的預處理,比如説低通濾波器,有源探測等等,普遍性的應用是剛才汽車的例子,這個概化屬性的案例比如説語意解釋,是像這樣的圖片過程當中,我們在這個圖片的輸入過程當中加入噪音,讓機器變得疑惑,這個到底怎麼樣,它會退出來。對抗性的樣本是數據部分固有的,是固定任何模型的。説到無法識別的樣本,機器跟人最大的區別,就是我們覺得沒有問題的東西它會覺得無法識別。這些東西到底是什麼呢,需要輸入一定的干擾才能夠識別。

    2016-11-17 15:59:33

  • 饒·寇他科裏:

    給大家舉一個深度神經網路學習的案例,比如説是飛艇、油菜籽等等,都是有不同數據的,還有一些案例怎麼樣做優化?優化問題是非常容易做的。你來進行修飾性的輸入,然後把預測把它放大,還有一個遺傳核心演算法,就是初始的隨機種群。我們到底做了什麼呢?這裡面就是我們根據2016年模式識別國際會議上面的證則化舉證,用的舉證進行引領任意一組,這個是我給大家列在上面的公式。比如説先進行隨機投射,隨機投射的引理,一般來説在計算的時候,都是用隨機預設。也就是説隨機投影、隨機影射,然後再做正則化矩陣。只要可以讓P2PK保密的話,你的系統是完全可以設計出來的,系統最後可以有非常強大的穩定性。

    2016-11-17 15:59:50

  • 饒·寇他科裏:

    我們的結果是藍色的這一部分,大家看Epochs,數據可以學習的週期,,可以學習的數量越來越大,學習成本會越來越低,錯誤率會越來越高,藍色的就是錯誤率的降低。當然我們會有一些比較危險的,你輸入太多噪音干擾的話,會有一定的風險。我們看到Net1和Net2,Net1是生成噪音的地方,Net2是我們的目標系統。我們看一下穩定性、穩健性,以及怎麼樣對抗這些樣本的穩定性,我們也可以看到輸入一定的噪音干擾之後可以降低三分之一的錯誤率,這個就是神經語言網路學習,當然大家需要去理解這些理論,我們如果知道背後的理論才能夠進一步的利用它,減低錯誤的機率。我們在實驗的過程當中,也發現了隨機系統是非常穩健的,可以做到非常高度的隨機性,99%的隨機性,可以看到神經系統隨機語言可以達到百分之百的隨機性。在整個系統的穩定性方面,基本上可以達到90%的提升。接下來會做什麼呢?我們用隨機投射,進一步利用到回界回腦的架構當中,我們會繼續利用這一點,然後是對抗性的擾亂或是干擾。謝謝大家。

    2016-11-17 16:00:09

  • 主持人 高春東:

    謝謝饒·寇他科裏教授。接下來有請中國科學院院士,中國科學技術大學常務副校長潘建偉教授,以“新量子革命:用於更安全和高效的大數據分析”為主題的演講,大家歡迎!

    2016-11-17 16:00:27

  • 潘建偉:

    很高興能夠參加今天的論壇,我的話題是新量子革命或者量子飛躍,為了能夠更加安全和有效地進行大數據分析,我們為什麼需要大數據分析,剛才幾位非常傑出的學者都做了比較好的闡述。一方面從各式各樣的資源進行數據收集的時候,我們是需要有網際網路的安全性,希望數據能夠被安全的收集。同時我們採集到數據之後,希望也能夠對數據進行有效的挖掘,我們需要很強的計算能力。

    2016-11-17 16:23:03

  • 潘建偉:

    但是在這些事情當中,我們有幾個挑戰。第一個就是網際網路的安全性,其實我們在伺服器的終端,在我們的資訊的傳輸的過程當中,和伺服器當中都存在著各種各樣的漏洞,所以都有一種潛在的威脅,覺得我們的資訊有可能被洩露。但是為了解決這個問題,我們可以用加密的演算法,比如説通過身份認證來確保用戶的合法性。同時在傳輸的過程當中,通過對數據的加密來保證資訊不會被竊取。與此同時也通過數字簽名,可以比較好的保證我們的數據在傳輸的過程當中不會被篡改。但是在所有的傳統做法當中,都是依賴於加密演算法,通常加密演算法是依賴於計算的複雜度演算法。我們把全世界的計算能力收集起來看一下,要對某個數據庫進行搜索的話,它只能對一個2的80次方數據庫進行搜索,密碼破解的時候,我們在收集的過程當中,破解的能力是非常有限的。

    2016-11-17 16:44:31

  • 潘建偉:

    非常有意思的是,量子力學從前是為經典技術提供非常好的方案,我們晶片各種各樣的期間有賴於量子力學的發展,量子力學研究的本身,也為了解決剛才所講到的這些問題提供了可能性的解決途徑。

    2016-11-17 16:44:57

  • 潘建偉:

    具體的來説,運用了量子力學的基本原理。我們都知道,在量子力學裏面,我們説比特可以用一隻貓的死和活兩個狀態來看,比特在微觀世界裏面,在物理上怎麼來實現呢?我們可以用光子的極化,比如説電磁波在真空當中傳播的時候,沿著水準的偏正,未知的量子態是不能被精確複製的,這是這個定理告訴我們的。

    2016-11-17 16:45:09

  • 潘建偉:

    比如説利用所謂的當光子不可分析性,單光子一顆一顆的,對於量子不可克隆的定理,如果存在竊聽者,這個方法是不能做的,只能進行複製或者測量。測量完之後就會引入噪聲,就會覺察。用這樣的方法,在兩個之間建立安全的密鑰,這樣的安全的通信方式是依賴於物理學的基本原理,而不是依賴於計算的複雜度。這樣的話,我們就能夠保證由物理學基本原理所保證的網際網路的安全性。與此同時,當我們利用量子糾纏的概念,拓展到很多粒子的時候,我們就可以涉及一些特殊的量子演算法,利用量子疊加原理,我可以分解一個300位大數,目前的ClassicalTHz15萬年,用量子的1秒鐘就可以了,從這樣的角度講,量子的計算功能是比較強大的。

    2016-11-17 16:59:43

  • 潘建偉:

    還可以舉另外一個例子,在求解方面,利用目前最廣的太湖之光,相當於100個24個方的線性方程組100年左右,用量子電腦需要0.01秒完成了。但是真正的把這樣的機器研製出來,我們還是需要比較長的時間,所以目前對我們物理學家來説,我們主要的精力是集中在量子模擬上面。利用這樣可控的量子系統,我們可以來計算一些目前的每天的電腦所算不了的事情。比如説可以來求解一些方程,專門求解高溫超導裏面的機制或者霍爾方面相關的研究,這是我們這個領域裏面的一些基本原理。

    2016-11-17 16:59:57

  • 潘建偉:

    總體上來講,目前我們估計上正在做這麼一件事情,就是説為了實現這麼一個大尺度的LargeScale,首先用光纖構建各種各樣的網,這個技術是比較成熟的。同時利用所謂的Scale將各個城市之間連起來,兩個連接起來會比較有效,到了更廣的時候來實現廣域的LargeScale。有了這些事情以後,我們可以比較好的來做未來的一些發展。目前在我們中國,比如説我們已經在2012年的時候,已經能夠相關的技術覆蓋到6000平方公里的來支援千節點、萬用戶的相關需求了。這麼一來,這樣的系統目前比如在北京,已經投入永久使用了,來進行一些相關的安全的使用。除此之外我們目前也在構建所謂的北京到上海之間的量子通訊網路,就是骨幹網路,骨幹網路昨天正好是上海到合肥之間所有的設備開通了,昨天正好在國際會議上給國外學者做相關的展示,這是700公里光纖,這個到今年年底也會完全開通,開通之後可以用於一些銀行的轉賬等等。

    2016-11-17 17:00:12

  • 潘建偉:

    另外我們也在開展一個相關的工作,是跟量子衛星緊密結合的,我們其中的主要任務,希望能夠實現一個高速率的,衛星和地面之間的密鑰的分發。我們在今年的8月份,量子衛星正式發射之後,已經開展了相關的實驗。相關的實驗,我們在星龍地面站,這是我們衛星的軌跡,這是我們地面對天上進行跟蹤,我們曝光是5到10秒鐘,天上的信號是完全可以看到的,點就變成一條線了,到目前為止非常好的建立了天地之間的鏈路,目前的速率大概每妙鐘傳輸的密鑰是在20000個左右,所以基本上可以滿足一些安全資訊傳輸相關的需要。

    2016-11-17 17:01:02

  • 潘建偉:

    在量子計算方面,因為我們目前很難想像電腦到底是一種固態的?還是業態的?還是氣態的?大家都不清楚,相當於從前我們討論説我告訴你有一台有非常好的演算法能夠算的很快,大家會問你你這個電腦到底是用珠子玻璃做的?還是竹子做的?還是木頭做的?經常會問我們將來的電腦到底是用原子做的還是什麼做的?目前回答這個問題還太早了。目前我們這個領域有用離子的、光子的、Cavity-QED等各種各樣的系統,我們來進行相關的研究,希望能夠找到一種適合於進行量子計算的體系,在這個過程當中,我們有幾個任務是需要完成的。

    2016-11-17 17:01:19

  • 潘建偉:

    第一個需要能夠對量子的狀態進行高精度的支配和操縱,能夠讓它有很長的存儲和相關時間。如果計算都還沒計算完,如果就死掉了,那你就很難獲得正確的結果了。為了讓計算能力越來越強大,所以需要把好多粒子糾纏起來。只有這樣我們才能夠進行有效的量子計算。

    2016-11-17 17:01:38

  • 潘建偉:

    目前比如説在我們的體系裏面,我們已經做了一些相關的演示,比如説做各種各樣的量子演算法的演示。我們可以用我們的量子演算法來有效地求解線性方程組,我們知道方程組的求解在信號處理,在經濟學的分析,在計算科學和物理學方面是廣泛應用的,求解這麼一個方程組的話,相當於做這麼一個反向的求解,找到一個A負的矩陣,把X等於多少求解出來。找到這麼一個矩陣,首先找到A的本正值engenvalues,大概需要這麼多步。有了這個方案之後,就可以構造所謂的矩陣。

    2016-11-17 17:01:52

  • 潘建偉:

    假定我們有這麼一個方程組,這是一個非常簡單的遊戲機一樣的,我們構建這麼一個比較小的所謂的Serqute,之後我們就可以在實驗上來驗證我們確實有這麼一種計算可以在小的步驟裏面完全量子計算。但是這個過程的話,我們也可以把它用到所謂的機器學習裏面。在這個地方對一個數據進行分類,我們這裡有很多Samplevector,有好的Vector,還有壞的Vector。

    2016-11-17 17:02:02

  • 主持人 高春東:

    謝謝潘建偉院士,讓我們再一次用掌聲對潘建偉院士的精彩演講表示感謝。

    2016-11-17 17:02:19

  • 主持人 高春東:

    尊敬的各位來賓,女士們,先生們,接下來請電器和電子工程師協會可拓展計算委員會主席陳金俊先生,以“大數據—大應用”為主題進行演講,大家歡迎!

    2016-11-17 17:02:28

  • 陳金俊:

    各位領導,各位嘉賓,大家下午好!現在很多人都在談大數據,各個國家、各個企業、各個地方。有的人會説數據和石油一樣,是重要的資源,也有的人會説數據加人才是現代企業很重要的決定性的力量,有很多包括Bigdata等不同的,關鍵的核心點都是類似的,就是從大數據當中找到有用的資訊,對於企業來講新的産品、新的機會,對政府來講新的管理模式等。

    2016-11-17 17:02:46

  • 陳金俊:

    對大數據的看法有很多種,不同的人有不同的看法,還有人從投資的角度,不管你怎麼看大數據,最基本的概念是要有價值要有Value,沒有價值,不管數據多麼大,其實沒有太多的意義。從Value的角度講,關心的是能不能從大數據分析出更多有用的信心,比如説新的産品,相比較傳統的企業單個分析數據,跨行業,不同種類的數據分析,可能會令人更加的激動。過去幾年雲計算的普及以及深度合作,擁有很多不同種類的數據成為可能。不像以前我們只能設想我們有很多種數據,現在因為雲計算很普及,大家把數據放在雲上,擁有不同種類的數據成為現實。

    2016-11-17 17:03:02

  • 陳金俊:

    當然單個領域數據的分析缺失是很重要的,比如説一個超市的零售業,你對用戶購買興趣消費的分析很有用,不同種類的數據分析,不同種類的數據因為雲計算的普及,因為大數據成為可能。我們的觀點,對企業家來講分析不同種類的數據。

    2016-11-17 17:03:13

  • 陳金俊:

    一個真實的例子,在澳大利亞跟我合作的企業,有訂飛機票的企業,還有超市的企業,原來他們是兩個不同的企業,他們各自管理各自的數據,現在因為雲計算的原因,他們把數據放在雲上,比如説有人經常晚上買東西,這樣的人你就應該推薦晚上的飛機票。把不同種類的數據之間微弱的關係找出來,這種微弱的關係往往意味著新的市場、新的産品,這個在以前大數據之前,在雲計算之前不是很容易想像的。因為那個時候你並沒有把不同種類的數據放在一起。

    2016-11-17 17:03:29

  • 陳金俊:

    對於做研究的來講,我們知道要做大數據,首先得有大數據,因為要但量多,數據更新特別的快我們知道對大多數研究者來説我們沒有真實的數據,企業不太願意跟我們分享他們真實的數據,可能基於各種各樣的原因。所以我們只能用一些官方的數據,對於研究者來講,如果要更有效,我們要接觸真實的數據。如何接觸真實的數據?要更多的要跟企業合作,解決他們的問題,可以訪問他們的數據。否則的話,我們訪問的網上公開的數據往往並不是實的。

    2016-11-17 17:03:43

  • 陳金俊:

    在這個階段上,無論從企業來説,分析不同種類的數據,對科研人員來講的話,要接受真實的數據進行分析,在目前的階段大數據更多的是應用。你現在去定義大數據科學,其實並不是一件很清楚的事情,什麼是大數據科學?更多的是應用。從應用當中産生一些數據的科學,然後解決問題。基於這個出發點,我們跟很強的跟企業合作,現在最典型的兩類行業,零售業和航空訂票的行業,就是因為把不同種類的數據放在一起,找到他們微弱的關聯性。

    2016-11-17 17:03:53

  • 陳金俊:

    這種微弱的關聯性剛才説了,比如很多人晚上出去買東西,你就給他推薦晚上的飛機票,還有把醫院的數據和保險公司的數據放在一起分析,分析過去兩年醫院的健康的情況,然後可以幫助保險公司設計出更好的保險産品,這是兩個真實的例子。總的來講,就是把不同種類數據放在一起找出不同的關聯性,産生新的商機,是企業關心的,這是大數據帶來新的機會,在雲計算普及之前只能設想不同的數據放在一起,現在因為雲計算數據放在一起産生大數據,擁有不同種類的數據成為現實。

    2016-11-17 17:04:09

  • 陳金俊:

    跟企業合作的時候,企業常常問我們的問題非常簡單,尤其是一些傳統企業,他們並不關心你跟我講的大數據,就告訴我能得到什麼。另外一個問題是你説把我這些數據不同種類的放在一起,醫院的數據,保險公司的數據。比如説訂票的會員數據,還有超市的數據放在一起進行分析,你怎麼保證他們的隱私?這是他們直接問我的。

    2016-11-17 17:04:28

  • 陳金俊:

    做企業大家知道,並不關心三年、五年,我要的就是現在。所以他一定要很快速的,相應的就在這三方面做分析,不同種類的數據之間把關聯性找到非常微弱的關聯性往往意味著新的商機,如果關聯性非常強並沒有太大的意義,你能看到的機會別人也可以看到。大數據不同種類的數據分析出來找到微弱的關聯性,就像剛才醫院和保險公司一樣即刻幫助保險公司提供更好的産品。就像剛才説的超市和訂票公司一樣,可以告訴訂票公司更好的推進産品,不同種類的數據覺得因為雲計算過去的普及産生的,因為大數據産生的新的比較集中的點,這並不意味著單純的一個點不重要,是重要的。

    2016-11-17 17:04:42

  • 陳金俊:

    另外關於隱私安全,做隱私知道的,隱私的問題是非常主觀的問題,什麼隱私?什麼不隱私?如何基於應用設計出考慮到設計、空間,主要是隱私,昨天我生病了,昨天是隱私,今天我好了就不是隱私。最後的結論點就是説大數據不管怎麼看它,最終還是回歸到價值,一定要有價值,從價值的角度看它。如果沒有價值,這個數據再大也沒有意義。

    2016-11-17 17:04:56

  • 陳金俊:

    從應用的驅動産生價值,在這個階段應用驅動會更恰當一些,考慮什麼是數據科學。更加令人激動的是不同種類的數據找到它的關聯性意味著新的商機對企業來講及因為雲計算的普及,大數據不同種類的數據成為現實,是一個新的點,是一個比較激動的點。這是我們一個觀點,也是我們正在做的,謝謝大家。

    2016-11-17 17:05:12

  • 主持人 高春東:

    謝謝陳金俊先生,讓我們再次用掌聲對陳先生的精彩演講表示感謝。接下來有請中國資訊通信研究院總工程師余曉暉先生,以行業自律推動建立大數據流通信任體系為主題進行演講。大家歡迎。

    2016-11-17 17:05:26

  • 余曉暉:

    各位專家,各位來賓,大家下午好,很榮幸在這兒有一個機會跟大家分享我們對大數據流通資訊體系的思考。全球也是同樣,我們中國也非常重視大數據的發展。我們知道國際上有一個説法,數據進行創新成為我們經濟社會發展範式轉型很重要的驅動力,在中國把它看成非常重要的戰略位置。我們面對一個很大的問題,在我們釋放大數據潛能的時候,怎麼能保持這樣的數據的安全和可信任。如果我們要把大數據的潛能發揮出來的話,很重要的是我們怎麼建立信任體系當然這是覆蓋各個環節的信任體系,能夠保持我們有效的合法的應用,今天彙報的是從流動環節説。

    2016-11-17 17:05:39

  • 余曉暉:

    三個部分的內容,首先是簡單提一下目前中國大數據發展的情況,這個是大數據産業基本的認識,這裡面分為兩個部分。一個是從數據本身的分析存儲交易安全所形成的産業,我們叫核心産業。一種是跟大數據相關的觀點産業。按照IDC的預測,大體上我們可以看這個圖,大體上到2020年的話,這樣加起來的話有2500億美金的規模,大概增長20%。我們中國資訊研究院有一個關於中國市場的預測,大體上也是2000個人民幣,增長是30%。我個人覺得我們的增長預測保守一點,大體上可能到未來幾年,我們有幾千億的市場還是非常有可能的,這個市場很小的,相比中國的資訊産業的市場,我們中國資訊産業現在有16萬億,這個並不是很大。這裡面一定代表我們很大的方向。

    2016-11-17 17:06:29

  • 余曉暉:

    在這樣的情況下,我們去看這個産業的各個環節,我們説從數據的生産到數據的流通和數據的應用,其實每一個環節裏面都有非常重要的問題需要解決。當然我今天給大家分享的是我們覺得在數據流通的環節裏面,是連接數據的來源和數據應用裏面非常關鍵的承上啟下的環節。所以這個環節的安全可信任,對發展是非常重要的。

    2016-11-17 17:06:54

  • 余曉暉:

    從國際上來説,我們也觀察到,可能主要的國際上的國家裏面有很多的企業上在數據的流通方面做了很多的工作。當然這些工作我覺得對大數據的商業化的成功是非常有意義的。回到中國來説,我們可以看到中國也非常重視這樣的環節,2015年,去年我們國內第一家是貴陽大數據交流所正式運營,到現在為止,到今年9月份超過10家的大數據交易所,所以這個發展是非常快的。有這麼多的國內大數據交易所的建立,它的目的是想建立説怎麼把數據和應用連接起來,能夠真正地把數據的潛能發揮出來。

    2016-11-17 17:07:05

  • 余曉暉:

    這是我們的一個基本的態勢,最大的挑戰是怎麼能保護數據的合法利用,怎麼保護每個們的隱私?這是一個非常重大的挑戰。那麼從數據的各個環節裏面,比如説我們從數據的收集會面臨數據的不透明性,或者收集很多超量的收集,從數據的分析來説,會出現過度的數據分析和挖掘,每個人畫像等等。還有數據流動環節裏面,有這麼多環節在裏面的時候,怎麼控制數據按它的許可權合法的使用,這個是非常難保證的。這個是我們面臨的非常大的挑戰,我們怎麼去解決這些環節,保證我們數據可以充分的利用。

    2016-11-17 17:08:59

  • 余曉暉:

    關於規則方面來説,我們其實要建立一個交易的規則,這個交易的規則裏面,我們怎麼確定數據的權屬?怎麼進行定價、評估,怎麼進行監管?從事前、事中和事後,我們怎麼建立一個全閉環的安全可信任的體系?這是我們中國,甚至全球來説都是一個處於探索階段的事情。我們知道每個國家的情況不太一樣,關於大數據的戰略,大家都非常得重視。但是關於大數據的流通和大數據保護方面也有很多的探索,我們知道現在做的最嚴格的是歐盟今年推出的GDPR,一般的數據保護條例,對數據的保護流動做了很多的規定。美國也有類似的,但是沒有歐盟的嚴。

    2016-11-17 17:09:19

  • 余曉暉:

    關於規則方面來説,我們其實要建立一個交易的規則,這個交易的規則裏面,我們怎麼確定數據的權屬?我們怎麼進行定價、評估,怎麼進行監管?從事前、事中和事後,我們怎麼建立一個全閉環的安全可信任的體系?這是我們中國,甚至全球來説都是一個處於探索階段的事情。我們知道每個國家的情況不太一樣,關於大數據的戰略,大家都非常得重視。但是關於大數據的流通和大數據保護方面也有很多的探索,我們知道現在做的最嚴格的是歐盟今年推出的GDPR,一般的數據保護條例,對數據的保護流動做了很多的規定。美國也有類似的,但是沒有歐盟的嚴。

    2016-11-17 17:09:32

  • 余曉暉:

    最後,我們就回到另外一個層面,就是説我們的大數據的法律體系毫無疑問,需要我們的人大,需要我們中國的法律體系建立這個環節,但是我相信跟全球一樣,建立這樣一個能夠平衡好發展和隱私發展保護的關係的法律環境恐怕不是一天兩天能建成的。在這個過程中,我們還有一個非常重要的工作,怎麼讓我們的行業自律?我們這麼多企業裏面自發的形成一個體系,能保證我們的大數據可信任的流動和交易。這是我們國內正在推的一個工作。在這裡面怎麼建信任體系?什麼樣的大數據産品的服務值得信賴的?事前對用戶所關注的所有問題裏面。有一個真實的承諾,把這個承諾實現。怎麼通過第三方的評估監督和資訊公開使它這樣的服務是透明的,我們是能夠符合它的承諾的。

    2016-11-17 17:10:00

  • 余曉暉:

    事後如果出了問題以後,我們有一個風險的賠償機制,能夠彌補救濟,這是三個環節要考慮的內容。我們從數據的安全來説,包括數據的可靠性,數據的隱私保護等等,這是我們需要考慮的。從服務品質來説,我們對數據的使用者來説,或者説接受方來説,必須保證數據的品質。所以這樣數據的品質管理方面也是非常重要的,還有權益的保護裏面,可能也是比較重要的。

    2016-11-17 17:10:14

  • 余曉暉:

    在這樣的情況下,我們也是中國資訊通信研究院和我們中國業界一起正在推動和建立我們中國大數據行業的信任體系,數據的流通行業我們現在目前可以考慮的數據應用範圍,授權的要求和流程,可交易的數據類型,交易的方法和定價指導,目前我們已經發佈了數據流通行業自律公約,4月份發佈了第一版,7月份發佈了第二版。

    2016-11-17 17:10:24

  • 余曉暉:

    下一步重點開展基於《自律公約》進行第三方的評估和測試。這裡面是我們的一些主要內容,網上也可以看得到,準則和數據的權益,從合規採集權益協調進行規定,數據流通流向管控和數據保護,包括認證和附則。我們也和一些企業合作,包括阿里巴巴、360、中國電信、中國聯通等等,這是非常好的基礎。意味著中國的企業可以通過自發的努力,構建一個可信任的數據應用和流通的環境,我想這對中國的大數據探索和發展是非常關鍵的。我們是希望借助這樣自律的方式,結合中國的法律體系和監管,構建一個中國大數據發展很好的環境,推動整個數據在中國經濟社會發展中的應用,謝謝大家!

    2016-11-17 17:10:48

  • 主持人 高春東:

    謝謝余曉暉先生,讓我們再次用掌聲對余曉暉先生的演講表示感謝。接下來有請鄧白氏公司全球高級副總裁、首席數據科學官安東尼·斯格非亞諾先生,以使用現代數據科學解讀現代商業行為為主題演講,大家歡迎。

    2016-11-17 17:11:08

  • 安東尼·斯格非亞諾:

    簡單跟大家講一下我們經常説數據、數據、數據,每個人都在説數據、大數據。我想跟大家從商業的角度來看看我們用所有的比如説量子通訊、量子演算法,我作為一個數據分析科學官,那我肯定會用這些所有的分析方法來分析的。我覺得我們應該退一步來想,數據到底用來幹什麼,或者數據代表著什麼樣的意義?在網際網路高速發展的時候,我們到底應該看到的是什麼樣的資訊?

    2016-11-17 17:11:37

  • 安東尼·斯格非亞諾:

    其實現在的常態我們可以把它叫做“新常態”,我們變化的常態,也就是説變化的速度非常快。什麼是一直在變化著呢?只有變化是永遠不變的,所有的東西都在變。什麼是新發生的呢?新發生的也是變化,我們可以看到,比如説網上我們可以分析數據,但是這個數據只有一個部分的數據,所有的手機、電腦、會議、人類活動都在産生數據,比如今天我們現在在這個會議場裏面説的所有的話,我們今天的發言,都會産生數據。在網上,大家可以問各種各樣的問題,你可以找到客服提問問題,未來或者現在回答你問題的可能是機器而不是一個人,所以我們為自己提出這些問題,我們都不知道怎麼去回答這些問題。那這樣一種常態我們把它叫做“新常態”。

    2016-11-17 17:13:22

  • 安東尼·斯格非亞諾:

    我們現在到底有什麼樣新的問題?不管是零售業、銷售、政務、物流、後勤等等,所有這些方面都會有各種各樣的問題,他們給我們提一個共同的問題,我們都有數據,但是我們拿這些數據在自己的單位裏面,並不能使用它。

    2016-11-17 17:13:40

  • 安東尼·斯格非亞諾:

    我們的挑戰是什麼?在這樣的一個“新常態”當中,我們怎麼樣來利用我們手頭的數據呢?我們來看一下現在的世界,比如説數據可以像集裝箱一樣打包,然後進行運輸,企業的地理位置、結構、消費者的現實互動真的變得越來越不重要。你要的是什麼呢?我們要的是你的網路行為,我們聽到很多網路的東西,網路行為、網路的駭客、網路的風險等等。我們怎麼樣來回應它?我一般這麼回答,你先看一下鏡子,你看看鏡子裏面自己這個人,看看自己的單位,你的公司,你看到了是什麼呢?你需要把自己也變成一個新的人來適應這樣一種新的常態,那麼我們把它叫做新技能,包括數據科學對新技術的掌握與人的消極感知力,語言融合,數據使用的許可,身份的辨識監測等等。

    2016-11-17 17:13:52

  • 安東尼·斯格非亞諾:

    我們不僅僅要考慮到數據,還需要考慮數據之間的相關性。你在自己的公司裏面的時候,你肯定不是説我把數據收集回來放在這裡,然後我就可以理解它了。不是這樣的,我們首先不能把數據放在一個地方,傳統上我們用現實的貿易和關聯判斷實體間的主要方法,現在不行了,現在所有的事情都在變化。不像原來你把一個産品,一種服務放在一個地方,你慢慢地研究它、發現它。現在不是這個樣子,現在當你研究這個數據的時候,其他的數據又在發生,新的數據又在産生。

    2016-11-17 17:14:17

  • 安東尼·斯格非亞諾:

    所以我們需要有這樣新的思維,建立一種實時的理解。我們的數據方法,計算方法都會不一樣,這是我們的現實,現實社會就在這樣子發生。我們經常在想這麼一個問題,我們如何來應對這樣一個真實的世界呢?把數據科學引入到我們的討論當中。給大家一個例子,在所有的單位、所有的公司,我們所有的每一個公司都需要互聯互通,我們需要整合大數據和對結構的理解來探索連通空間,就是一個真正的連通空間,因為數據産生的太快、太多、太大,所以你沒有時間來想。比如説現在我們大家之間從來沒有互相打過電話沒有相互了解過,未來企業也會這樣子運營,你有非常非常多的公司,從來都沒有相互的交易過,沒有相互做過生意。但是他們可以相互使用數據,可以慢慢地,最後形成這樣一種共識和合作。

    2016-11-17 17:15:02

  • 安東尼·斯格非亞諾:

    也就是説我們進行與構造類似的圖形相混合,類似的圖形進行一種融合,各種各樣的資訊,這個事件、數據、新聞、信號等等,然後我們用抽象維度進行一種假像的場景。我們現在有一個説法,就是要應對黑貓問題,在黑色的房間裏面有一隻黑貓你看不見它,因為貓也是黑色的,房間也是黑的,一樣的,如果機器學習,我們經常在説機器學習,那它到底在不在呢?你不知道它在不在,確實是真的不在那。現在用一種思維方式,我們用信號,我們用系統性的檢測方法,我們用異常檢測,我把它叫做均質性,也就是説你的某一個方面跟其他的所有方面都是不一樣的,這個叫均質性。然後是特性和品質監測,當所有的數據都在那裏的時候,你可以去截取跟你一樣的部分,或者跟你不一樣的部分來用在你的系統當中。這樣才可以處理黑貓問題。關於黑貓問題,所有的電腦的課堂上都沒有教學,但這正是我們需要思考的問題,我們有這麼多的科學家,我們都沒有應對這樣的問題。

    2016-11-17 17:15:25

  • 安東尼·斯格非亞諾:

    這裡就涉及到了創新的問題,什麼叫創新?新的産品、新的服務、新的能力。但是我們要記住,創新就是找到大問題,把它大事化小,一個一個的阻擊它,解決這個問題,這也是創新的形式,這種創新的形式是我們需要的,我們需要非常得開放,我們需要有一種新形勢的創新,我們要有非常開放的思維。今天做了這麼多事情,明天就可以産生盈利了,但是我們必須要這樣子來做。我們需要有一個新的思維的模式才可以適應這樣一種新型的世界。

    2016-11-17 17:15:37

  • 安東尼·斯格非亞諾:

    我們要顛覆現在所有的真理,因為我們知道原來存在的一些可能如此珍惜的東西,嫌它太慢太差,在數字化時代,我們嫌它太有顛覆性了。我們現在要想,所有的可計算的數據是什麼呢?我們要去想這些數據我們怎麼用?我們怎麼樣解決新的問題?怎麼樣把數據用到極致?用到真正有用的地方。比如説有沒有人使用大數據去發現石油,有人去買石油嗎?沒有吧?但是我們大家都把數據比作石油,但是我們需要的是怎麼樣來用,用才是最重要的。

    2016-11-17 17:15:48

  • 安東尼·斯格非亞諾:

    未來的方向,我們都在説機器會進行學習,怎麼學習呢?你需要去教它。我們才是使用的人,我們需要向機器學習,也讓機器學到更好的方式,非常有意思的未來。我們當然並不需要去學計算的方法,因為你是這些技術的應用者,是真正的受益者,所以你要知道怎麼用,這些數據是哪來的。

    2016-11-17 17:16:03

  • 安東尼·斯格非亞諾:

    這是一些大型跨國機構中數據的演變,演變是永恒的,我們用所有的技術、科技這是肯定的,然後我們需要有正確的科技來處理數據,來改變我們的思維模式,真正的核心是服務於人,並且思維也是從人發出的。

    2016-11-17 17:16:24

  • 安東尼·斯格非亞諾:

    最後是以數據為導向的組織中,領導力思維的演變,領導力非常得重要,所有的領導需要非常的有啟發性,你對技術要有認知,讓你的員工有足夠的創造力,去啟發他們。最後我來引用威廉·愛德華茲·戴明的話,只是盡力做到最好是不夠的,你必須先知道要做什麼,然後才能做到最好。所以我們首先要尋找先理解,我們到底需要做到的是什麼,然後寫下來共用、討論我們這一代是我們驅動自己的數據,應用我們的數據的第一代人。好,非常感謝大家的聆聽。

    2016-11-17 17:16:35

  • 主持人 高春東:

    謝謝安東尼·斯格非亞諾先生,讓我們再次用掌聲對他的精彩演講表示感謝。接下來有請奇虎360公司高級副總裁兼首席安全官譚曉生先生,以“數據驅動的安全協同,保護重要資訊系統及大數據安全”為主題進行演講,大家歡迎!

    2016-11-17 17:25:54

  • 譚曉生:

    360是一個安全公司,而且是從2009年開始採用大數據方法,用於資訊安全的一些防範。去年烏鎮網際網路大會上面,可以看到展示給習主席全球DDos攻擊的全景,那個是隨時可以知道全球正在發生的DDos攻擊是什麼,他們的控制端是什麼,打什麼端口,DDos打了多長時間?

    2016-11-17 17:26:44

  • 譚曉生:

    無時無刻都在收集網上的資訊進行展示,這是我們把它叫做看見的力量。看網路的攻擊了解攻擊的全貌,講出來攻擊的故事,這是非常典型的網路攻擊的故事的模型。

    2016-11-17 17:27:27

  • 譚曉生:

    在這裡的我們現在用的方法是什麼呢?一個是我們叫做數據驅動,在今天如果是僅僅採集到了一部分資訊,今天是遠遠不夠的,可能需要原始流量,比如説網路流的資訊,可能還需要用戶在終端裏面人的行為,程式的行為等等這一系列的東西,我們今天的工作方面已經轉向由數據驅動的工作方法。

    2016-11-17 17:27:46

  • 譚曉生:

    這個從2009年年底的時候,360對惡意樣本的分析,對人工找特徵變成經濟學預演算法進行自動的分類。到三年多之前,我們對於網路流量,全部採集下來之後,對流量進行還原,試圖用統計概率和經濟學預演算法找出異常。

    2016-11-17 17:28:06

  • 譚曉生:

    第二個是智慧的提升,這些年的演算法及我們從簡單的用SVM這樣的分類,演變到後來機器學習更高深的演算法。到現在也有用於協議識別和網路外部攻擊的判定,這是一個智慧的提升,這是主要在演算法上的改進。

    2016-11-17 17:28:26

  • 譚曉生:

    第三個産業聯合,産業聯合更多的是基於情報的交換,我們自己為全球的其他的安全研究人員提供服務,同樣其他的安全研究人員他們的數據也會公開給我們,大家會在這方面有情報的交換。在這三個基礎智商有一個更高的層面是叫協同,這個協同不僅僅是數據交換是協同比較低的層面,再往上是能力的協同,很多數據量大到根本沒有辦法交換,交換的時候拿到數據也不知道怎麼用。所以對數據的分析,最後出來的結果或者事情的處置會變成更高層面的協同。

    2016-11-17 17:28:40

  • 譚曉生:

    終端安全經過了3、4年前一段時間的低谷,最近兩年大家對終端安全更加的重視起來,網路中經過加密的流量越來越多,超過50%。這時候攻擊者必然要拿下來某一個終端,這時候的終端是非常好的資訊手機裝置以及最終産生動作的裝置。

    2016-11-17 17:28:54

  • 譚曉生:

    在這裡講到EDR對所有行為,對文件操作,對進程資訊,對網路訪問,對文件傳輸和文件內容都可以進行採集。同樣的話終端是可以接受控制指令,對某個程式進行阻斷,殺死某個進程,組織某個網路操作等等一系列的行為,這是在EDR。NDR網路中間加密的流量越來越多,即使在這樣的情況下,在這方面也可以做更多的檢測和相應的。

    2016-11-17 17:29:11

  • 譚曉生:

    因為有終端沒有覆蓋到,或者終端已經被感染之後,已經不能正常的行使資訊的探測和阻斷的行為,可以第二個知道系統中發生什麼事情的機會。這裡麵包括了我們對資産的發現,對於一些終端行為的補充的發現,對於網路行為,對於可以在日誌等等這樣的事情,EDR加NDR現在變成有兩個大的數據來源和産生處置的地方。

    2016-11-17 17:29:26

  • 譚曉生:

    最終在應用上面我們分成兩個場景,一個是在集團的內部,它需要知道它有什麼樣的資産,正在發生什麼事件,有四張屏,四屏聯動,在任何一張螢幕進行操作,其他的螢幕內容感知會推出來你想要的東西,做四屏聯動這是一個外部的感知場景。

    2016-11-17 17:29:53

  • 譚曉生:

    舉的例子是一個城市,一個城市中間的網路的安全的狀況是什麼樣子的,我有沒有什麼網站?有沒有什麼樣的威脅?我的基礎設施,比如説物聯網的設備,工業控制系統等等有沒有什麼問題?在這裡有外部的感知。外部的感知一方面會要有全網的主動的資訊探測的能力,還有從某個區域之內,從終端設備到網路設備採集資訊上傳之後綜合的匯總。

    2016-11-17 17:30:09

  • 譚曉生:

    最終我們提出一個理念叫做DataDrivenIndustryCollaboration,我們有數據驅動之下的,有産業基於能力協同的戰略合作可能是會解決我們網路安全的一個出路。謝謝大家。

    2016-11-17 17:30:23

  • 主持人 高春東:

    謝謝譚曉生先生,再次用掌聲對譚曉生先生的精彩演講表示感謝。接下來有請螞蟻金融服務集團安全管理部總經理邵曉東先生,以“大數據時代的金融安全”為主題演講,大家歡迎!

    2016-11-17 17:30:46

  • 邵曉東:

    各位嘉賓,大家下午好。非常高興榮幸能夠參加這次論壇,聽了前面很多位的專家學者他們的講話,非常認同他們的觀點。當然我也會利用這個機會跟大家分享一下我們大數據時代的金融安全應該怎麼做。記得兩年前,也是在這個大會上,馬雲先生曾經提過,人類社會已經從網際網路時代走向了大數據時代。

    2016-11-17 17:31:10

  • 邵曉東:

    這兩年來,我們能夠看到的是以利他主義為核心價值的大數據時代正在為每一位從業者、創業者提供著前所未有的機遇。聚焦在我們大數據時代的網際網路金融,它是以網際網路技術、網際網路思維方式以及大數據驅動的,有別於傳統金融的新金融模式。它極大地降低了金融服務的交易成本和溝通成本,並且因為它開放、平等的特性,也為我們中小企業和普通的民眾提供了普惠的金融服務,是現有金融的有益補充。

    2016-11-17 17:31:29

  • 邵曉東:

    當然,我們看到網際網路金融為廣大民眾帶來極大便利的同時,我們也感知到網際網路安全日益嚴重的趨勢。現在黑灰産業鏈正在形成生態,各種資訊被販賣,木馬、釣魚網站正在不斷地威脅著我們的網路安全。

    2016-11-17 17:31:44

  • 邵曉東:

    2014年南韓爆發了史上最嚴重的一個資訊洩露事件,四成人口的信用卡資訊被洩露,就在剛剛過去的10月份,始於美國東部的DDos攻擊席捲了整個美國,包括《紐約時報》在內的網站都沒有被倖免。因此,如何保障網際網路金融安全,已經是我們必須去面對和要解決的問題。

    2016-11-17 17:32:16

  • 邵曉東:

    我們螞蟻金服通過多年的實踐,在網際網路金融領域裏面主要會出現有別於傳統金融的四大風險:第一,系統風險,網際網路系統是包括網際網路金融在內所有網際網路生態的基礎設施,網際網路金融的業務開展和安全技術都依賴於網際網路系統。所以系統一旦被攻擊,我們的用戶,金融行業,甚至我們整個社會都會造成混亂。所以我們要保障我們的系統是安全的,只有系統安全了,才能保障我們的網際網路金融安全。

    2016-11-17 17:32:32

  • 邵曉東:

    第二,我們的資訊安全。網際網路金融隨著普惠以及與場景緊密結合的業務模式,使我們在業務開展過程當中會積累各種各樣的數據。而這些數據又會覆蓋商業秘密,用戶的個人隱私,所以我們必須在數據的産生、儲存、管理、使用各個環節確保資訊數據是安全的。

    2016-11-17 17:32:47

  • 邵曉東:

    第三,帳戶風險。網際網路金融的帳戶與傳統金融的帳戶是有很大區別的,它已經沒有了像信用卡、存摺這樣的中間介質。如何保障帳戶背後的人就是帳戶使用者本人呢?這已經是擺在我們面前最重要的安全課題,最後是資金風險。

    2016-11-17 17:33:03

  • 邵曉東:

    前面我們講到,不管我們怎麼樣去保障我們的系統安全、資訊安全以及我們的帳戶安全,其本質最終目的都是需要保障我們的資金安全。在這樣一個新機遇、新挑戰同時又面臨著新威脅的環境下,我們在網際網路金融領域,如何用新的安全模式保障我們的網際網路金融安全呢?我覺得需要有三個“一”。

    2016-11-17 17:33:23

  • 邵曉東:

    首先我們需要一場變革,這場變革就是從被動的防禦到主動的管控,為什麼這麼説?因為在傳統金融領域,我們為了保障金融的安全,我們有厚厚的水泥墻和防爆門做一個金庫,把資金可以管控起來。

    2016-11-17 17:33:37

  • 邵曉東:

    我們在銀行網點之間進行資金運輸的時候,我們可以有武裝運鈔車和武裝押運人員,這樣不管是誰會在什麼時候用什麼樣的方式,在什麼樣的地點對我們進行攻擊的時候,都能得到相對有效的防範。

    2016-11-17 17:35:07

  • 邵曉東:

    而在網際網路金融已經不一樣了,我們沒有銀行網點,甚至很少能看到現金,我們在網際網路上也沒有地方讓你去搭建一個厚厚的水泥墻以及防爆門。那我們怎麼樣保障我們的網際網路金融的安全呢?我們必須從被動的、事後的防禦轉化到事前的主動管控。我們必須要在行為結果發生之前就要預測到誰可能在什麼時候,可能用什麼樣的方式,可能在什麼地點對我們進行攻擊。

    2016-11-17 17:35:30

  • 邵曉東:

    甚至於我們要具備主動進攻的能力,才能保障我們的安全。而要實現這場變革,我個人認為最核心的武器就是我們的大數據以及我們的新技術。

    2016-11-17 17:35:46

  • 邵曉東:

    螞蟻金服經過多年的實踐,已經形成了一套完整的風控體系,整個螞蟻金服集團有五分之一的員工從事直接與安全相關的工作,而這些員工當中,我們的數據工程師和技術工程師佔了三分之二,我們用2800多臺伺服器,數十個模型,上千條規則,搭建了智慧風控的平臺,而這個智慧風控平臺可以在十分之一秒的時間從八個緯度對每一筆交易進行一個風險的預測和判斷。

    2016-11-17 17:36:08

  • 邵曉東:

    同時我們也特別注重像生物識別技術這樣新技術的開發,我們到目前為止,人臉識別技術已經在我們帳戶註冊、帳戶識別以及整個交易過程當中進行了廣泛的應用。目前識別的準確率達到了99.6%,整個場景的通過率超過了90.5%。因此螞蟻金服的止損率遠遠低於十萬分之一。

    2016-11-17 17:37:05

  • 邵曉東:

    舉一個案例,有一位黃先生45歲住在深圳,他的帳戶突然有一天的晚上,23點35分的時候,在廣州,一個從來沒有使用過的設備上登錄了。並且在0點07分的時候,他的帳戶通過短信校驗方式進行了修改支付密碼的動作。

    2016-11-17 17:37:20

  • 邵曉東:

    同時在0點25分的時候,這個帳戶還在試圖購買一台蘋果手機。在0點25分當他確認支付的時候,其實我們系統已經判定這個帳戶的操作行為不是黃先生本人。所以我們當他確認支付的時候,我們失敗了這個交易,並且在第二天10點03分,我們的客服人員與黃先生本人進行了溝通,確認黃先生的手機中了木馬,然後我們的客服人員幫助他做了必要的安全維護。

    2016-11-17 17:37:35

  • 邵曉東:

    這就是用大數據來實現我們風險控制的典型案例。要實現這場變革,我覺得我們必須要具備一種能力,什麼能力?就是保障我們資訊數據安全的能力。

    2016-11-17 17:37:59

  • 邵曉東:

    個人覺得數據是要用起來才有價值的,數據是越用越有價值。數據使用它不是簡單的一個物理疊加,它是像生命一樣,會發生奇妙的變化。同時開源、開放才是使用數據的一個首要條件。剛才有嘉賓也分享到,我們會把保險的數據和醫療的數據整合起來,這需要數據開放。

    2016-11-17 17:38:14

  • 邵曉東:

    但是我這裡想説的是,要開放必須知道什麼叫關閉,要學會關你才能很好的開,你如果不會收,你沒資格談放。要讓我們的大數據在這場變革當中發揮巨大的作用,你首先要做的是要保障你的資訊數據是安全的。那麼我們螞蟻金服在這方面也做了很多的工作,做了很多的投入,已經搭建了一套完善的數據安全管理體系,並且獲得了多個國內國際的權威認證。

    2016-11-17 17:39:20

  • 邵曉東:

    公安部、資訊系統的安全等級保護認證,中國資訊安全檢測中心的系統安全保障的一級認證,以及國際卡組織頒發的PCIDSS數據安全認證和ISO27001資訊安全管理體系認證。

    2016-11-17 17:39:38

  • 邵曉東:

    最後我想講要實現這場變革,除了具備保障數據安全的能力以外,還必須要形成一個數據生態。我們要通過大數據應用去實現主動的管控,去預測是誰在什麼時候可能在什麼地點可能通過什麼樣的方式對我進行攻擊。

    2016-11-17 17:39:55

  • 邵曉東:

    光靠一個企業是不夠的,我們必須形成各方的合力。我們螞蟻金服目前正在與中國最高人民法院和各個銀行機構共用老賴的名單和風險的數據,這種數據的共用,不僅有效的能夠助力我們整個社會誠信體系的建設,同時也極大的提高了我們金融機構應對信用風險的能力,提高我們徵信的能力。謝謝大家!

    2016-11-17 17:40:10

  • 主持人 高春東:

    謝謝邵曉東先生,讓我們再次用掌聲對他的精彩演講表示感謝。接下來有請北京亞信數據有限公司首席執行官張灝先生,以“大數據助力中國貧苦治理”為主題演講。大家歡迎!

    2016-11-17 17:40:27

  • 張灝:

    各位嘉賓大家下午好!也很高興站在這裡來給大家分享我們在大數據方面的一些應用的案例,亞信數據是亞信集團的子公司。我們致力於中國民生和幫助政府做民生政務,用大數據解決國家治理提升的問題。貧困這個領域我想應該不一定很熟悉,但是在全球來講,貧困人口一直是處於不同分佈的地區。

    2016-11-17 17:40:45

  • 張灝:

    在中國也有很多的地區處於貧困。我們看到説最近也是在講説國家治理的能力的問題是制約整個經濟發展,特別是貧困地區的核心原因。我們可以看到當治理的微觀數據不精準的話,會就是造成你國家可以提供的公共産品和服務能力的不均衡。因此也會導致所謂的貧困的産生。只有全面精準的把數據做微觀的採集,才有可能制定出來真正有效的宏觀的政策。

    2016-11-17 17:44:13

  • 張灝:

    因此微觀數據的採集,對於我們現在宏觀政策的制定,其實産生越來越重要的作用。我們也看到説,我們在貧困地區,如果今天講大數據、網際網路的發展趨勢非常猛,如果説火車頭走到人工智慧改善我們生活品質的時候,在車尾的時候,我們很多的地區人口和治理,還沒有達到一個到達的狀態。

    2016-11-17 17:44:28

  • 張灝:

    我們可以看到大數據要想做到一個任何垂直業務應用的話,都需要有充分數據的基礎。對於貧困地區,我們可以看到我們也切實走訪了很多的地方,看到基礎數據的採集能力是很低的,如何通過四個層面的工作來做。

    2016-11-17 17:44:44

  • 張灝:

    比如説從數據的充分的收集,我們講精準,如果識別精準都有問題,這個是沒有辦法去準確的幫助的。由於在貧困地區,包括手機的使用,雖然得到很大的提高,但是現在還是有很大的一些不足。因此我們如何用現代的,包括扶貧的手機應用,包括一些線下的資源去進行有效的對接,我們可以把扶貧工作用大數據實現全面精準這個事情做好。

    2016-11-17 17:44:59

  • 張灝:

    從平臺角度來講,我們有很多的數據可以去抓取,包括貧困戶本身基本的資訊,空間的資訊和時間的資訊,這些東西都標誌著他貧困的狀態和貧困的變化。政府的數據其實非常的多,可以看到各個部委的數據是分散的程度是比較高的。但是如何針對貧困人口扶貧,因為地理位置等等因素導致貧困的原因進行精準的對接,實現對於他們的幫助,這個非常重要。

    2016-11-17 17:45:16

  • 張灝:

    第三方數據,我們也有很多慈善機構,也很多的慈善人士希望對他們進行救助,但我們需要精準地找到誰需要什麼,這個問題到現在為止也沒有得到一個很好的解決。因此在這三方數據來講都需要通過數據充分的聚合,來實現用大數據治理的基礎。有了這些數據,我們看到底用什麼業務支援他們呢?

    2016-11-17 17:45:34

  • 張灝:

    我們可以把馬鈴薯産品運出去,通過電商來做,通過教育提升來實現對於網際網路使用的方便,通過旅遊,通過社會的救助,包括醫療,醫療我們佔42%的貧困的原因,到底什麼病什麼藥能夠幫助他們,這些實際需要非常精準的對接。把線上和線下打通,這就是可以把業務來實現完美的結合。

    2016-11-17 17:46:07

  • 張灝:

    有了業務的場景以後,就需要更多的去運營,我們看到大數據,如果我們只是拿統計報表的數據,幫助貧困人口也起不了什麼作用。如何把他們的生活中的數據真正的採集過來,它的每一次幫助,它的每一次自發的生産,我們用手機其實是在解決貧困戶本身是一個被動的狀態,變成一種用應用的能力,用移動網際網路實現主動參與到扶貧的工作中,這樣其實就更像我們城市的人口一樣積極的跟上經濟發展和科技發展的紅利。因此我們在實踐中,已經做了很多的場景。

    2016-11-17 17:46:22

  • 張灝:

    這些場景都可以通過充分的互動,扶貧的幹部、扶貧的對象充分進行互動,實現很多數據的交互和採集,這個數據越來越豐富的時候,我們可以看到説它不僅是一個幫扶的過程,還是一個新商機的産生。因此我們看到這樣的方式是可以真正幫到貧困戶的。

    2016-11-17 17:46:36

  • 張灝:

    第四,當有這些數據以後,更好的用數據的價值來驅動政府的治理政策,以及各級政府對於扶貧工作細化的措施,讓數據保持鮮活的前提有了以後,包括識別項目的安排、資金的安排等等,包括事後評估的效果,這個真正做到一個平臺之下的數據的精準的識別能力。

    2016-11-17 17:46:52

  • 張灝:

    這裡舉兩個例子,一個是我們健康扶貧,現在看到由於過去的方法去採集因病治貧的數據是非常簡單粗暴的,包括採集週期也非常慢,一年一次。包括我們可以看到他們自己是小病變成大病的現象非常多,所以如何在早期給他們提供識別可能變大病的可能性,提早進行藥品和醫療方法的輸入非常重要。

    2016-11-17 17:47:08

  • 張灝:

    同時也把國家對於社保的政策,真正落到這些人身上,來降低他們對醫療成本的負擔,讓有更大的醫療資源,有效的通過網際網路對接到,用大數據找到你的條件和誰最需要,最終能夠完美對接的話,這就是一個非常好的效果,目前看這方面是非常值得越是在貧困的地區,越是需要人工智慧,越是需要這樣精準的識別,這樣的效率才有可能是更高。

    2016-11-17 17:47:25

  • 張灝:

    總結來講,我們看國家這麼重視貧困工作,我想中國2020年實現小康社會的目標,其實小康社會核心的問題解決5700萬的貧困人口的脫貧,實際上如果我們僅靠過去的方法,用政策和資金的支援是遠遠不夠的。如何讓這樣的群體能夠享受到網際網路大數據的紅利,通過把國家的資源、社會的資源和慈善志願者的資源,能夠有效的通過大數據來對接,實現全網跨平臺的大數據的運營模式,圍繞數據驅動的運營模式,我想能夠把我們大數據對於扶貧的治理會提升的更好。

    2016-11-17 17:47:41

  • 主持人 高春東:

    謝謝張灝先生,讓我們再次用掌聲對他的精彩演講表示感謝!接下來有請一起作業網CEO劉暢先生,以“大數據,讓學習成為美好體驗”為題發表演講,大家歡迎!

    2016-11-17 17:48:08

  • 劉暢:

    大家下午好!非常高興能夠參加今天的大數據的論壇。我叫劉暢,來自“一起作業”,是一家K12的線上教育平臺。今天我為大家分享的主題叫做“大數據,讓學習成為美好體驗”,我們知道這幾年大數據開始在中國乃至世界教育發揮越來越多的作用。所以今天我更想從學校教育、家庭教育甚至城市教學管理來分別講述一下大數據對於教育到底産生了怎樣的改變。

    2016-11-17 17:48:41

  • 劉暢:

    首先,我們來看第一點,大數據對於學校教育的作用。我們覺得最大的價值,一定是讓老師從教書轉變到育人。今天,越來越多的網際網路工具讓老師從非常傳統的工作當中解放出來,比如説作業可以自動批改了,老師應該把更多的時間放在育人上。

    2016-11-17 17:52:27

  • 劉暢:

    如果有了數據,讓老師更好的了解每一個孩子的性格特點,能夠找到每個孩子的特長,真正激發孩子的興趣,把育人的工作做好了,其實教書就會變得很容易。

    2016-11-17 17:52:43

  • 劉暢:

    看一個真實的中國案例,來自於中國上海今日學校,這個小學是一個農民工子弟學校,90%的學生家庭都並不富裕,而且孩子們的學習成績參差不齊,這裡的主人公老師叫做倪佳青老師,有兩個班,一個班稱為叫做對照班,另外一個班叫做實驗班。倪佳青老師工作非常簡單,就是通過“一起作業”後臺的數據給全班不同的學生佈置了不同的作業和練習,不到三年的時間我們看到數據有了非常的大的變化,我們發現實驗班的成績都非常快的提高。

    2016-11-17 17:53:01

  • 劉暢:

    其實背後的道理和原因很簡單,當每一個孩子都能夠得到個性化內容的時候,這個時候學生們實際上會獲得學習一種最美好的感覺叫成就感。解決了一個學習動力的問題,學習的主動性,學習的分數就會自然地上升。

    2016-11-17 17:53:17

  • 劉暢:

    其實今天,“一起作業”已經連接了137萬個老師,上千萬的學生和上千萬的家長,每天有上億條的學習數據在産生。數據越多,我們給每個學生的個性化學習路徑就會規劃的越科學,大數據開始讓學習開始成為一種美好的體驗。

    2016-11-17 17:53:33

  • 劉暢:

    我相信,大數據對於學校的老師而言,最大的改變是讓老師從依賴於經驗的教學,慢慢的是靠數據驅動來教學。從解決班級的共性問題,到解決每一個孩子的個性問題。到從幫助孩子學習,到真正幫助每一個孩子進行能力成長,大數據真的可以讓老師從教書慢慢的走向老師本應該有的職責,叫做育人。

    2016-11-17 17:54:04

  • 劉暢:

    大數據對於家庭而言,我們認為最大的價值貢獻叫做記錄成長看見未來。我們看一組來自“一起作業”後臺上千萬的學生和家長我們分析和統計的數據,數據很有趣,70.2%的家長認為對孩子陪伴不足,下面的數據説給在座的爸爸媽媽們,有93.6%的家長陪孩子的時候看手機,上千萬的數據統計,我們看到當父母同時關注孩子的時候,我們後臺的成績可以達到平均分90.21分,如果只有媽媽關注孩子的成績,平均分是87.13分,如果父母都不關注孩子,很不幸平均分是81.74分。

    2016-11-17 17:54:22

  • 劉暢:

    陪伴對於教育的力量,我們可以舉一個非常真實的例子,故事的主人公來自山東青島,在這個城市當中,有一個家庭離婚了,父母離開了之後,孩子跟父親在一起,母親每天很難過,很想了解孩子的一切。他只能及時打電話鼓勵自己的孩子,發現小孩兒有哪些單詞掌握的不好,有哪些數學題掌握的不好,打電話通過數據給孩子指導,大數據網際網路真的沒有辦法解決兩個人物理界面的問題,但是他們的心卻連在一起。

    2016-11-17 17:54:54

  • 劉暢:

    大數據網際網路實際上對家庭教育的價值遠不只如此,我們知道隨著越來越多學習數據的收集,包括孩子心裏測評數據的收集,我們相信中國的家長未來,包括現在已經開始通過數據越來越科學的幫助家長進行小學階段興趣培訓班的選擇,到了初高中階段文理的分課,甚至到了大學階段高中階段對於大學學科的選擇,大數據越來越多的讓家長從感性的對孩子的認知轉化到更加得理性,更好的通過數據記錄孩子的成長,能夠幫助孩子更好的判斷未來。

    2016-11-17 17:55:12

  • 劉暢:

    大數據對於我們的城市教育,乃至國家教育,我們總結一下,最大的價值叫做數據驅動、教育均衡。我們知道過去受傳統的技術條件限制,大多數的區、省是依賴於每學期一次或者每年一次的抽測或者統一考試進行教學評估。

    2016-11-17 17:55:28

  • 劉暢:

    但是這樣的數據統計和以天為單位的,每天數以億計的作業統計對比的話,大量的數據統計對學習的分析變得更客觀。第二以每天的數據來對老師進行反饋,這樣的反饋恐怕對教學的幫助會更大。

    2016-11-17 17:57:38

  • 劉暢:

    我們來看兩個有價值的例子,第一個例子,是來自於對北京市所有的小學聽説讀寫四項技能的數據統計和分析,我們看到非常有趣的是,隨著過去的兩到三年中國有大量的APP訓練小孩語音的軟體出現。我們突然發現,中國在北京這個城市為例,好的地區和不好的地區,這四大技能反而差異最小的是“説”這個技能。好的地區和不好的地區,差異4.5%。但是寫作的差異高達9.8%。

    2016-11-17 17:57:58

  • 劉暢:

    再舉一個例子,“一起作業”也開始響應國家的號召,在後臺引入了各種素質作業的內容,我們引入了很多西方的繪本。我們在後臺看了各個省、市、區對素質類作業的引入比例,我們發現中國各個地區差距很大。

    2016-11-17 17:58:23

  • 劉暢:

    標注的有北京、上海、廣州屬於第一陣營,我們驚訝的發現使用相對來説比較差的倒數後面兩個省有兩個是我們超越我們認知的,一個湖北省和山東省,這兩個省都是中國著名的高考大省,高考的壓力從高中傳導到初中,甚至傳導到小學,我們的數據未必全面,但是這樣的數據可以方便國家行政主管部門可以更好的通過數據能夠管理教育,更好的促進教育公平。

    2016-11-17 17:58:42

  • 劉暢:

    最後,特別感謝網際網路大會,感謝大數據論壇給教育一個機會,給教育一個舞臺。科技中有溫度,數據裏有夢想。特別希望“一起作業”可以跟更多的教育網際網路公司真正助力中國實現教育的強國之夢,謝謝大家。

    2016-11-17 17:59:00

  • 主持人 高春東:

    謝謝劉暢先生,讓我們再次用掌聲對他的精彩演講表示感謝。尊敬的各位來賓,各位朋友、各位專家,女士們、先生們,剛才11位嘉賓圍繞大數據的發展與安全這一主題做了精彩紛呈的演講,對助力大數據可持續發展可以説有著非常重要的現實意義。在這裡,我想用一句話為今天的大數據論壇做總結,我們今日所研討,正是為了未來更美好的生活。再次向各位參會嘉賓表示衷心感謝。第三屆世界網際網路大會大數據論壇到此結束,謝謝大家!

    2016-11-17 17:59:21

圖片內容:

視頻地址:

    http://mp4.china.com.cn/video_tide/video/2016/11/17/201611171479389419420_360.mp4

數據地址:

    http://webcast.china.com.cn/webcast/created/29306/152_1_0101_desc.htm

圖片大圖:

  • 第三屆世界網際網路大會大數據論壇現場

    中新社記者劉關關 攝

  • 中國科學院秘書長鄧麥村發言

    中新社記者 劉關關 攝

  • 圖靈獎得主、卡耐基梅壟大學機器人研究院創始院長雷伊·雷蒂教授發言

    中新社記者 劉關關 攝

  • 中國工程院院士,中國科學院計算所研究員倪光南發言

    中新網視頻截圖

  • “大數據”分論壇現場

    中新網視頻截圖

  • 澳大利亞科學院院士、澳大利亞工程院院士饒•寇他科裏發言

    中新網視頻截圖

  • 中國科學院院士,中國科學技術大學常務副校長、教授潘建偉發言

    中新網視頻截圖

  • 電器和電子工程師協會可拓展計算委員會主席陳金俊發言

    中新社記者 劉關關 攝

  • 中國資訊通信研究院總工程師余曉暉發言

    中新社記者 劉關關 攝

  • 鄧白氏公司全球高級副總裁兼首席數據科學官安東尼•斯格非亞諾發言

    中新網視頻截圖

  • 奇虎360公司高級副總裁兼首席安全官譚曉生發言

    中新網視頻截圖

  • 螞蟻金融服務集團安全管理部總經理邵曉東發言

    中新網視頻截圖

  • 北京亞信數據有限公司首席執行官張灝發言

    中新網視頻截圖

  • 上海一起作業資訊科技有限公司創始人、首席執行官劉暢發言

    中新網視頻截圖

文字實錄 查看全文 正序 倒序 刷新