中南大學教授研發“中國版AlphaGo” 相當於業餘二段(圖)

2016-03-13 11:25:31 來源:中國青年網 作者:佚名 責任編輯:高靜 字號:T|T
摘要】李世石又輸了,AlphaGo連勝三場。就在人們熱議人類是否要在圍棋領域完敗的時候,一些棋友卻開始想到武坤和他的“MyGo”,並將其稱為“中國版的AlphaGo”。而武坤自己卻表示,他的“MyGo”即便能在國內奪冠,但與AlphaGo對比,遠遠無法望其項背。

\

  2015年,在民間被稱為“中國版的AlphaGo”的“MyGo”軟體,在世界電腦圍棋錦標賽上對抗國際同類程式供圖/武坤

  李世石又輸了,AlphaGo連勝三場。就在人們熱議人類是否要在圍棋領域完敗的時候,一些棋友卻開始想到武坤和他的“MyGo”,並將其稱為“中國版的AlphaGo”。而武坤自己卻表示,他的“MyGo”即便能在國內奪冠,但與AlphaGo對比,遠遠無法望其項背。

  武坤是中南大學數學與統計學院教授,他的“MyGo”也是一款圍棋人工智慧。2015年11月,首屆美林谷杯世界電腦圍棋錦標賽在北京工體附近進行,在來自全世界的參賽隊中,“MyGo”只屬於第三梯隊,相當於圍棋業餘二段的水準,而錦標賽的冠軍也無非圍棋業餘五段水準。那時誰也沒想到,僅僅四個月後,他們全都被AlphaGo橫掃了。職業九段的李世石慘敗,而且還是三連敗。

  製作三個月研發用了三年

  在中南大學,武坤對於圍棋的熱愛,所有上過他課的學生都知道。武坤甚至專門開了一門課程,就叫“圍棋人工智慧”。

  他的“MyGo”誕生於2011年,製作過程只用了三個月,但研究過程卻是三年。2008年,武坤認識了職業八段圍棋選手王群,和王群的交流讓他發現,職業圍棋選手的思維和一般人有明顯的區別,而這種區別可以用軟體的形式錶現出來,他説這就是製作“MyGo”最早的念頭。

  “二十歲不成為國手,則終身無望”,這是圍棋界的常識,學圍棋必須從小開始,但武坤直到上了大學才開始接觸圍棋。製作“MyGo”之前,武坤沒做出過任何軟體,而“MyGo”的前三年“全都在做理論基礎”。武坤告訴北青報記者:“比如最簡單的問題,大家都知道執黑先走,但是先走的是有優勢的,因此圍棋規則都會給執白棋的棋手一些優惠,即‘貼目’,那麼這個‘貼目’到底多少合適呢?圍棋發展幾千年了,一直都是憑感覺來定的。”武坤説,包括“貼目”在內的諸多圍棋要素,都需要進行數據化,這個過程最久也最艱難。

  跨過“理論基礎”這個坎,武坤和他的團隊就用了三年。

  全國冠軍也只是世界第三流

  2012年,武坤帶著“MyGo”的第一版參加了全國電腦博弈錦標賽,這是中國一個專門供電腦圍棋人工智慧比賽的平臺。據介紹,該比賽的主辦方包括中國人工智慧學會和中國棋院,比賽項目除了圍棋,還有象棋、六子棋等,是各種“中國版AlphaGo”的競技場。

  第一次參賽,武坤的“MyGo”只拿到了全國第三,2013年第二次參賽還是第三名。武坤和學生們做了數十次改進之後,2014年第三次參賽,“MyGo”終於獲得了全國冠軍,又在其後的2015年蟬聯冠軍,這時起,“MyGo”終於出名了。

  雖然現在有人把“MyGo”捧為中國版的AlphaGo,但武坤自己認為,橫掃了李世石的AlphaGo跟傳統意義上的圍棋人工智慧根本就不是同一種東西。

  2015年,新科中國冠軍的“MyGo”走上了國際賽場,在首屆美林谷杯世界電腦圍棋錦標賽上,“MyGo”八戰兩勝六負,在9支參賽隊伍中僅排名第七。武坤表示:“前三名的人工智慧算是第一梯隊,第四到第六名算是第二梯隊,而‘MyGo’只能算第三梯隊,和前兩個梯隊之間的差距很明顯,很難下贏。”

  但這還不是跟AlphaGo的差距。AlphaGo雖然沒有參加2015年世界電腦圍棋錦標賽,但在這場賽事前一個月,AlphaGo已經“小試牛刀”了。AlphaGo在2015年10月與歐洲圍棋冠軍職業二段選手樊麾進行了五場對決,樊麾被無情碾壓,AlphaGo以5:0完勝。之後樊麾觀摩了2015年世界電腦圍棋錦標賽,他提出參賽的圍棋人工智慧水準和AlphaGo“根本無法相提並論”。

  AlphaGo技術遠超同類程式

  在AlphaGo手裏三連敗,沮喪的並不只有李世石,還有武坤。“本以為我們的‘MyGo’和世界最強的人工智慧只有業餘二段到業餘五段的差距,現在我們根本沒法估算跟AlphaGo的差距。”

  武坤解釋説,相比其他圍棋人工智慧,AlphaGo的程式演算法非常先進。“現如今,圍棋人工智慧經歷了三代演算法,第一代是窮舉演算法,即嘗試把所有可能的下法都算出來,然後取必勝的一個。如果能夠窮舉,那麼人類註定無法戰勝人工智慧,因為所有的變化都在人工智慧的掌握之中了。這對於西洋棋還有可能,但對於圍棋來説就不現實。”武坤説,包括“MyGo”在內,2015年參賽的9支隊伍中8支都採用了第二代演算法,這種演算法利用高頻次的隨機抽樣、動態評估、規劃路徑,選擇勝率最高的走法,也就是説並不試圖窮盡所有的下法,而只是抽選一部分下法,然後選出勝率最高的那一種。這種演算法大大提升了圍棋人工智慧的水準,使得其可以和業餘選手一較高低。但即使獲得了2015年全球錦標賽冠軍的南韓人工智慧“石子旋風”,在和職業七段圍棋選手連笑的對決中,先後在“人類讓四子”、“人類讓五子”的比賽中落敗,直到連笑為“石子旋風”“讓六子”,“石子旋風”才獲得一次險勝。

  而AlphaGo的演算法就遠遠超越了之前的演算法,利用人工智慧自我學習的能力獲得了飛躍。武坤説,其實類似AlphaGo這樣的人工智慧也曾經在2015年的錦標賽上出現過,即法國的GoLois,這款法國圍棋人工智慧可以模擬人腦神經元,具有主動識別、自適應等功能,在圖像處理方面也異常強大。然而由於技術還不成熟,在所有9款圍棋人工智慧中排名墊底。“當時我們大家就感覺到了這種模擬人腦思維的演算法的巨大潛力,但是沒想到,類似的人工智慧來得這麼快,這麼猛。”

  儘管如此,武坤對於未來仍有信心。他打了個比方:就像電腦發明之後,很快誕生了各種更新型的電腦一樣。“之前大家都是在尋找方向,現在AlphaGo為我們開闢了一個了不起的方向。隨著大家對新演算法的深入研究,相信會有大批類似AlphaGo的圍棋人工智慧出現,到那時中國也會有能做出超越世界超一流棋手的圍棋人工智慧,那才是真正的‘中國版AlphaGo’。”文/本報記者屈暢

 

              熱搜資訊