新聞源 財富源

2024年07月18日 星期四

財經 > 滾動新聞 > 正文

字號:  

電腦圍棋“大師”挑戰人類尊嚴最敏感地帶

  • 發佈時間:2016-01-29 01:30:31  來源:科技日報  作者:佚名  責任編輯:羅伯特

  一篇《自然》雜誌封面文章28日引爆輿論——名為“阿爾法圍棋”(Alpha Go)的谷歌電腦程式,在完全平等條件下以5:0完勝歐洲冠軍、職業圍棋二段棋手樊麾。《自然》以“All SYSTEMS GO”為題報道,指出電腦圍棋戰勝人類冠軍一切已然就緒。

  這當然不是説説而已:Alpha Go已經約戰近10年來獲世界冠軍頭銜最多的棋手、南韓天才李世石九段,獎金是由谷歌提供的100萬美金。

  國內媒體甚至用“人類最後的智力驕傲即將崩塌”來渲染此事,似也有據可依:兩個月前,首屆世界電腦圍棋錦標賽冠軍“石子旋風”(Dolbaram)對決中國現任圍棋名人連笑,結果被讓4子、被讓5子負,被讓6子勝,就被譽為“歷史性的突破”;此前,電腦圍棋甚至不足以成為業餘高段位棋手的對手,對弈職業棋手,被讓9子幾無勝績……放在18年前超級電腦“深藍”戰勝西洋棋世界冠軍卡斯帕羅夫之後、電腦圍棋博弈水準仍一直遠低於人類的大背景下,Alpha Go敢於挑戰世界頂尖棋手,確有一種石破天驚的震撼效應。

  那麼這一次,電腦圍棋戰勝人類,真的近在眼前了嗎?

  人類智力運動“皇冠上的明珠”

  電腦圍棋之難,首先難在這項被稱為人類智力運動“皇冠上的明珠”本身的多重復雜性。“最簡單的規則,最複雜的變化”,是對圍棋最簡單明瞭的概括。

  “圍棋具有巨大的狀態空間複雜度和博弈樹複雜度,又在本質上無法做準確的靜態盤面評估”,這使得即使採樣樣本足夠大,也有力所不逮之處。北京郵電大學教授、電腦圍棋研究所所長劉知青用以下一組數據來説明:狀態空間複雜度(用於搜索),圍棋是10172,中國象棋、西洋棋分別是1048、1046;博弈樹複雜度(用於決策),圍棋是10300,中國象棋、西洋棋分別是10150、10123

  另一重復雜,是圍棋落子選點無法驗證。一手棋有多大價值,數學證明,或搜索驗證,都難以勝任。“分析圍棋棋子位置,數目的多少,以及棋子之間的靜態關係(例如影響函數),無法完整、準確地評判圍棋棋子的作用和最終死活;圍棋棋子的作用和最終死活必須由博弈的具體進程決定”。

  令人震驚的巨大突破

  儘管Alpha Go此次完勝的對手並非職業頂尖棋手,中國圍棋隊總教練余斌九段仍感覺“吃驚”。以往認為,電腦圍棋“100年都不會有突破”的他,從中看到“關鍵的突破點已被找到”。

  劉知青把它看作“遠超過去”的巨大突破——已公佈的五局棋譜,經國內“準一線”棋手察驗,品質很高,“雖然離一線水準還有差距,但差距不大”。

  具有相當棋力、一直從事“網際網路+圍棋”的北京萬同科技有限公司CEO陳雷注意到,五局棋的對弈時間早于去年11月份的首屆世界電腦圍棋錦標賽,而彼時的賽後沙龍上,幾乎所有電腦圍棋技術從業者都相當樂觀地認可,電腦棋手平等戰勝人類,會在15—20年內發生。其實陳雷在“樂觀派”中亦屬最樂觀的,當時他就認為“10年內必有突破”;但“谷歌默默無聞地做,一下子拿出來”,仍“令人震驚”。

  深度神經網路讓Alpha Go顯著進步

  樂觀的理由,在於近年來“蒙特卡洛演算法”的應用,它在解決圍棋盤面“一手棋有多大價值、怎樣判斷形勢優劣”兩大核心問題上,比前輩做的都好。

  但此次Alpha Go明顯更進了一步。劉知青、陳雷介紹,它應用了目前人工智慧領域最熱門的卷積神經網路技術,能模擬人腦神經元,具有深度學習、主動識別、自適應等功能,在圖像處理方面異常強大。

  比如,作為其核心的兩種深度神經網路“策略網路”(policy network)和 “價值網路”(value network)的成功應用:前者,將盤面落子選點從幾百、幾十個大大縮減為三五個,逐漸接近職業棋手;後者,也是最難的,在盤面形勢判斷上,通過職業棋手棋譜的驗證、篩選,給出下一步的預判,這比以往基於海量數據的“蒙特卡洛樹搜索”(未加任何驗證)對職業棋手盤面符合率達到40%—50%要好很多。

  在此情況下,專業人士所最擔憂的“所有技術開發人員都不知道職業棋手是怎麼想的”,似可迎刃而解。

  Alpha Go會是另一個“深藍”嗎?

  至於令人矚目的3月份人機約戰,包括對電腦圍棋最樂觀的人在內,迄今沒有人明確表示Alpha Go會是另一個“深藍”。

  “具體結果不好説”,劉知青沒有明確勝負傾向,但技術發展這麼快,看不到“天花板”,“還有兩個月時間,誰知道會發生什麼”。

  余斌、陳雷都看好李世石。作為技術樂觀派,陳雷並非唯技術論者:“圍棋挑戰的不光是智力,而是體現了東方思想精髓。”以“極度定量”方式表達一切的電腦,目前還達不到戰勝李世石、柯傑等頂尖棋手的水準。

  曾任中科院自動化所所長的中國自動化學會副理事長王飛躍則把即將到來的人機大戰看成一次“炒作”,真正公平的設獎博弈,應該是打擂臺式的“混選”,而非指定棋手應戰。他更認為,在終極意義上,人工智慧戰勝人類是“偽命題”,因為只要規則明確,電腦圍棋戰勝人類“是遲早的事情”。

  (科技日報北京1月28日電)

熱圖一覽

  • 股票名稱 最新價 漲跌幅