量子計算、人工智慧與區塊鏈
發佈時間:2018-04-12 17:34:31 | 來源來源:光明日報 | 作者:張首晟 | 責任編輯:肖寒編者按
未來5年到10年,是全球新一輪科技革命和産業變革從蓄勢待發到群體迸發的關鍵時期。隨著全球新一輪科技革命的飛速發展,顛覆性技術革新風起雲湧,其中最引人矚目的包括量子計算、人工智慧與區塊鏈等。這些顛覆性技術與中國傳統文化有無聯繫?與基礎科學(如數學、物理學)有何關係?如何客觀認識這些前沿技術?本網發2018年1月獲中華人民共和國國際科學技術合作獎的美國籍理論物理學家、中國科學院外籍院士張首晟的報告。
目前,量子計算、人工智慧與區塊鏈是整個資訊技術行業中最重要的三大基礎技術。在將來,要使資訊技術真正能夠得到跨越發展,必須重視基礎科學,既需要物理學,又需要數學,因為物理和數學跟資訊技術革命有緊密的聯繫。
“天使粒子”的發現改變了量子電腦的研發睏境
在講量子計算之前,先講一講跟“天使粒子”有關的科學發現故事。現代很多有意思的科學發現,都跟哲學觀念的改變有所關聯,包括中華民族那些根深蒂固的古老哲學觀念。比如,好像世界從來都是正負對立的世界,有正數必有負數,有陰必有陽,有善必有惡。這種對立的世界觀,在基本粒子的物理世界裏也有呈現。
歷史上曾有一位非常偉大的理論物理學家狄拉克,他把愛因斯坦的狹義相對論和量子力學統一起來,在統一的過程中他做了一個非常簡單的數學運算,開了一個根號。在開根號的時候,始終會出現正負兩個解,一般人可能只關心“正解”,不關心“負解”。狄拉克把“負解”解釋成所有的粒子必然有反粒子,並預言所有的粒子必然有反粒子。
1928年的時候,物理界並沒有發現反粒子,大家都對他提出非常大的質疑,説他的方程肯定不對。他堅持自己的方程是對的。過了5年,他非常幸運,果然在宇宙輻射的射線裏面,物理學家找到了電子的反粒子,就是正粒子,命名為狄拉克海。
此後,基本粒子物理了有質子找到了反質子,有中子也找到了反中子,並且得到了應用。比如正電子在醫療領域裏面已經有了廣泛應用,有一种醫療測試叫PET,利用正電子和負電子可以成像,要測阿爾茲海默症,最好的辦法就是做PET。
今天,中國人對科學發展非常關心。科學發展最大的驅動力是什麼?我認為是對生活的好奇心。歷史上的理論物理學家,如牛頓,在蘋果樹底下,蘋果掉下來激發了他的靈感,萬有引力就發現了。愛因斯坦在坐電梯的時候,感覺到電梯的上下和引力的作用非常相似,由此創造了偉大的廣義相對論。
另外,科學的發展應該不迷信權威。狄拉克成為非常有名的理論物理學家後,科學家都非常堅信在世界上有粒子,必然有反粒子。但另外一位偉大的理論物理學家馬約拉納,他出於好奇心,問世界上會不會有一些粒子並沒有反粒子?他發明瞭馬約拉納方程,這個方程奇妙地描寫了有一種粒子沒有反粒子,或者它自己就是自己的反粒子。
後來,整個物理學界都在找夢寐以求的兩個粒子,一個粒子叫“上帝粒子”,2012年在歐洲的加速器中找到,預言它的那位物理學家希格斯得了諾貝爾獎,還有一個就是“馬約拉納費米子”。
我是做理論物理工作的,理論物理學家的工作一般是作出預言,讓實驗物理學家來測試。我的實驗小組在2010年的時候就預言了在一個組合型的器件裏面可以找到馬約拉納費米子。不過我們還需要找到一個信號能夠證明這種粒子的存在。
有一天,我想馬約拉納粒子只有一面,沒有反面,所以在某種意義上它是通常粒子的一半。我們理論小組做了大膽的預言:既然馬約拉納粒子跟通常粒子不一樣,在某種意義上它只是通常粒子的一半。所以它的電導率會不一樣,通常的粒子電導率是0、1、2、3整數倍,它必然會導致半整數倍的電導臺階。我們預言它會有0.5或1/2的臺階。後來我們理論小組就和實驗小組做了一個緊密的合作,做了實驗觀察,的確在0.5的地方,大家可以看到是實驗的原始圖案,在0.5的地方出現了臺階,證明了馬約拉納費米子的存在。我們取名為“天使粒子”,大家非常喜歡這個名字。
“天使粒子”跟資訊技術發展有什麼關係?
現在的電腦已經分成兩類,經典電腦和量子電腦。有些問題經典電腦就很容易解決,比如把兩個大的數乘起來,經典電腦可以算得很快。但一個數看能不能拆成另外兩個數的乘積,比如15可以寫成3乘以5,這個數比較小的話你自己也可以算出來。但是給你一個很大的數,經典的電腦要算這個數到底是不是兩個數的乘積需要花很長的時間,因為它用的演算法是窮舉法,把所有可能被除的數一個個除過來,最後才能確認這到底是不是兩個數的乘積,經典電腦算起來非常慢。
經典電腦只能用窮舉法,最後才算出一個答案。但量子世界是非常神奇的世界,是平行的世界。比如一個著名的試驗,如果我放出一個粒子,比如光子,它有兩個孔,要不是左邊,要不是右邊。但是量子世界有一種本真的平行在裏面,一個基本粒子在某一個瞬間同時穿過了兩個孔。要麼是左,要麼是右的話,圖像就不是顯示的圖像。
量子的世界本身是平行的。如果用量子世界來做計算的話就能夠秒算,把所有的可能性一下子算出來,因為量子世界有它本真的平行性,這是量子計算最基本的概念。但是要真正造出這個量子電腦是非常困難的,比如最基本的單位,經典電腦最基本的單位是比特,就是資訊要不是0就是1,用0、1就能夠表達所有的資訊,這是經典電腦的概念。但在量子世界裏面,一個粒子同時穿過左孔,又穿過右孔,處在某一種疊加的狀態。一個量子比特講不清是0還是1,它是處在0和1疊加的狀態裏面。大家聽一個比喻,薛定諤貓就處在死和活的疊加狀態裏面。這是一種非常奇妙的現象。但是由於這種基本的現象,説明一個量子的比特本身是不太穩定的,你去觀察一下周圍就知道它要不就是在左邊,要不就是在右邊,要不是0,要不就是1,任何一個噪聲就會對量子比特産生很大的干擾。
最近,量子電腦成為全球和美國著名公司特別關注的東西,谷歌、微軟、IBM、英特爾都在做投資,但根本上不能解決這個問題,因為一個量子比特是非常不穩定的,如果哪天告訴我們做了50量子比特,但關鍵的問題是有用的比特是多少,如果只有一個有用的比特,往往在這種量子計算的框架下需要10個、20個甚至40個、50個糾錯的比特來為它服務,使得量子計算很難真正實現。
但天使粒子的發現根本改變了量子電腦研發的困境,這是從量變到質變的過程。量子比特本身自帶糾錯的能力,就是我把通常一個量子比特能夠拆分成兩個天使粒子的。通常的粒子有兩面,天使粒子只有一面,所以天使粒子通常只相當於一個粒子的一半。所以通常一個量子比特就可以用兩個天使粒子來儲存它。一旦用了兩個粒子儲存它,它們在遙遠的地方,它們相互是有糾纏的。在經典世界裏面的噪音,它們相互之間是沒有糾纏的,這樣的話就沒法用噪聲來破壞由天使粒子所儲存的量子,所以這是一個革命性的改變。
所以,我在不久前在美國物理學會演講,説天使粒子是激動人心的發現,用來做量子電腦是多少比特就多少比特,不用附加糾錯的比特,自帶糾錯功能,這會對量子電腦的研製起到突飛猛進的作用。
機器人哪一天能夠做科學發現,那一天智慧機器就超過人了
人工智慧作為一個基本概念,20世紀60年代就已經提出來。今天人工智慧能夠有突飛猛進的發展,主要是很多新技術的匯總。根據摩爾定律的迭代,每過18個月能夠翻倍,如果用量子計算的話,就不只是按摩爾定律18個月翻倍,而是完全從量變到質變。這些年來,人類計算能力不斷增長。網際網路和物聯網的誕生,産生大量的數據。智慧演算法有突飛猛進的變化。大數據能幫機器學習。不過,人工智慧的基礎是各種數據,再好的演算法,再強大的電腦沒有數據的話也無法成為人工智慧。
人工智慧,現在雖然看到了它在突飛猛進,但我覺得還處在非常早期。為什麼這麼講呢?做一個簡單的類比,比如我們曾經看到鳥飛,人也非常想飛,但早期學習飛行只是簡單倣生,在人類的手臂上綁上翅膀,這就是簡單的倣生,但真正達到飛行的境界是由於人類理解了飛行的第一性原理——空氣動力學,有了物理原理和數學方程之後就可以人為設計最佳的飛行器,現在的飛機飛得又高又快又好,但並不像鳥,這是非常核心的一點。
現在人工智慧多是在簡單地模倣人的神經元,但我們更應該思考的,是在這裡面有一個基礎科學重大突破的機會,我們要真正去理解那個智慧和智慧的基本原理,這樣才能真正使人工智慧有根本性的變化。
到底用什麼樣的依據能夠真正衡量人工智慧達到人的標準?有人可能聽説過圖靈測試,圖靈測試是説人跟機器對話,但不知道對方到底是人還是機器。整個對話的過程中,你如果花了一天的時間根本感覺不出來,那就説明機器人好像已經達到人的水準。雖然圖靈是一個偉大的電腦科學家,但我並不贊同這個判斷方法。人的很多情感並不是理性的情感,要讓一個理性的機器學一個非理性的人的大腦可能並不是那麼容易。
所以我想提出一個新判斷方法,智慧機器人哪一天真正擁有超越人的智力?我認為人最偉大的一點,就是我們能夠有科學的發現,哪一天機器人真能夠做科學的發現,那一天機器就超過人了。
最近我在人工智慧方面寫了一篇文章,將會在美國的科學院雜誌上發表,裏面會提到,人類最偉大的科學發現,有相對論、量子力學等,在化學裏面最偉大的發現就是元素週期表的發現。智慧機器在沒有任何輔導的情況下,能不能自動發現元素週期表?可不可以幫助人類發現新藥,用機器學習的辦法能否發現新材料?這些是判斷人工智慧水準的標準。
實現區塊鏈和人工智慧互相共存發展,它們會是最有價值的
在今天的世界,個人會産生出很多數據,個人的基因數據、醫療數據、教育數據、行為數據等,這是發展人工智慧特別需要的。很多數據都是掌握在中心機構裏面,沒有達到真正的去中心化。區塊鏈的産生,能夠産生一個去中心化的數據市場。
我把區塊鏈的整個理念用一句話來描寫,叫“In Math we trust”,這種理念是建築在數學基礎上的。整個區塊鏈和整個資訊技術領域裏面最基礎的東西,是基礎數學,是能在數據市場裏面保護個人隱私,又能夠做出合理的統計性的計算。比如有一種非常神奇的計算方法叫零知識證明,它能夠向你證明我的數據是非常有價值的,但又不告訴你真正隱私的數據在哪兒。
有了區塊鏈之後,數據市場能夠使社會變得更加公平。現代社會最大的不公平是人們容易歧視一些少數派。但在機器學習的過程中最需要的就是那些少數派擁有的數據。如果今天機器學習的精準率達到90%了,使90%提高到99%,它需要的不是已經學過的數據,而是跟以前不一樣的數據。往往是少數的數據對機器學習來講是最有價值的。一旦我們的數據建築在區塊鏈的基礎上,再加上這些奇妙的數學演算法之後,我們就能夠擁有良性的數據市場。在這個世界裏面,達成區塊鏈和人工智慧互相共存的理念,它們是會最有價值的。
整個區塊鏈,大眾對它的認識還不是最根本的第一性原理認識。用最基本的物理學原理來講,達成共識就好比大家都同意同一個“賬本”,相當於在物理學裏面,磁鐵本來是雜亂無章的,但到了鐵磁態裏面它們指向的方向都是同一樣的。
達成共識在自然世界裏面也有,這種現象叫熵減的現象。達成共識,大家都朝一個方向的話,這個狀態的熵遠遠比雜亂無章的熵要小。達到這個共識是非常難的,因為熵總是在增的。
在區塊鏈上能達到一個共識系統都是用一種演算法,需要消耗能量。這件事情聽起來不合理,賬戶為什麼要耗費能量,但從物理學第二定理來講,這是非常合理的一件事情,因為達成共識本身是熵減,但整個世界的熵一定要增加,所以在達成共識的同時一定要把另外一些熵排除出去。這種沒有中心化的機制跟自然世界裏面磁鐵從雜亂無章的狀態達到有序的鐵磁狀態非常相像,消耗能量付出代價也是必然的趨勢。
所以理想的資訊世界,是未來每個人擁有自己所有的數據,完全去中心化的儲存,這樣駭客也不可能黑每個人的數據。然後用一些加密的演算法在區塊鏈上真正能夠達到既保護個人的隱私,又能夠做出良好的計算,不會發生像Facebook中很多個人的數據被盜用那樣的事情。
今天我們要解決的量子計算、人工智慧、區塊鏈技術的問題,都是整個人類的問題,中國科學家會面臨非常大的機遇,除了要把應用科技做好,還應該有真正原創的基礎科學突破,比如上述介紹的物理和數學原理,儘管這些東西聽起來比較抽象,比如熵增原理,正負電子。世界的奇妙,正在於基礎科學能夠給整個資訊技術行業提供廣闊的全新發展前景。(作者:張首晟,本版主題文章係作者日前在2018中國(深圳)IT領袖峰會上的報告,記者嚴聖禾、袁于飛採訪整理,照片除署名的以外,均來源於視覺中國)