來自“深度思維”內部的聲音
- 發佈時間:2016-04-01 02:30:56 來源:科技日報 責任編輯:羅伯特
■今日視點
本報駐英國記者 鄭煥斌
谷歌“深度思維”(DeepMind)公司“阿爾法狗”(AlphaGo)團隊科學家戴維·席爾瓦近日在倫敦大學學院(UCL)演講時,對前不久“阿爾法狗”與李世石的“世紀五局”之戰逐一點評。他表示,從“阿爾法狗”成就中獲得的啟示是:直接利用數據進行增強學習的方法或將更有優勢;人工智慧的最終目的是服務於人類,其前景非常樂觀。
低調的“深度思維”公司
“阿爾法狗”團隊在南韓的遠征吸足了全球媒體的目光,而在倫敦本部的該公司卻表現得出奇低調。“世紀五局”剛剛落下帷幕,公司新聞聯絡官就對科技日報記者表示“近期不會安排採訪”。不僅如此,公司還規定需經批准才能在公共場合舉辦與“阿爾法狗”有關的活動,旅英華人學者原計劃舉辦的一場研討會也因此被迫取消。
幸好,記者獲悉並參加了席爾瓦在UCL的專題演講。席爾瓦曾擔任公司顧問,並於2013年成為其全職一員,是《自然》雜誌該研究論文的第一作者。據UCL官網資料顯示,席爾瓦目前仍為該校電腦科學系講師,只不過“現在無限期請假,不在UCL,目前不接收任何新學生”。
率領團隊遠征南韓之後,重新回到昔日熟悉講臺的席爾瓦,面對擠滿整個階梯大教室的數百名熱心聽眾,比在記者招待會上的表現更加輕鬆和自信。在題為《阿爾法狗:圍棋“大師”背後的神經網路與樹搜索演算法》的演講中,席爾瓦對“世紀五局”大戰的逐局點評風趣幽默,不時引來聽眾的陣陣笑聲和熱烈鼓掌。
“世紀五局”局局精彩
在演講過程中,當席爾瓦把話題切入“世紀五局”,並在PPT中展示出世界冠軍李世石和“阿爾法狗”相關資訊的瞬間,現場聽眾不約而同地發出了會心的笑聲。
他介紹説,第一局比賽“阿爾法狗”獲勝歸因于比賽前半段“毫無人性”的下法,在開局後20分鐘內便取得主導優勢,這為其打開了局面。事實上,世界冠軍李世石在第一次交手後也稱,“‘阿爾法狗’前半段的下法,是任何人類圍棋手都很難企及的”。
在第二局比賽中“阿爾法狗”更是“贏得毫無疑問”。它的第19步和第37步下法在當時落子後便引起很大爭議,這兩步看似沒有邏輯的落子被許多專業圍棋手稱為“反常”決策。席爾瓦的解釋是,這看似“反常”的兩步棋背後,實際上是“阿爾法狗”的強大決策運算系統在對局面進行綜合考量後做出的決定,它是“精心設計且極其正確的”,也是決定勝利的關鍵性兩步。
席爾瓦認為第三局是“阿爾法狗”向人類真正展示其強大決策系統之優越性的一局。他評價李世石在這局棋中的整體下法都顯得較為保守,這正是因為“阿爾法狗”以其難以預測卻步步有力的進攻,使李世石難有迴旋餘地。
在“阿爾法狗”唯一落敗的第四局中,第79至87步的下法導致了其敗局。席爾瓦坦言這其中暴露了“樹搜索”的典型缺點:在樹搜索演算法中,系統為了提高其決策準確性往往會“修剪”一些不相關的序列數據。然而對於圍棋實戰而言,被系統“修剪”的不相關數據有時往往起著決定性的作用。
“阿爾法狗”在第五局獲勝也被認為不出所料。席爾瓦介紹,儘管前半局“阿爾法狗”處於劣勢,但在第90步中,“阿爾法狗”採取了首局中曾用過的佔據角落策略,以此追平了比分,並使得局面逐漸好轉,取得了最終勝利。
席爾瓦介紹,在“世紀五局”大戰前,團隊已對“阿爾法狗”進行了無數次與機器對決實驗,在與其他圍棋程式的比賽中,勝率可高達99.8%。而在與人類圍棋手的對決方面,今年1月28日,“阿爾法狗”便以5:0擊敗歐洲圍棋冠軍樊麾。
增強學習方法或更有優勢
席爾瓦毫不掩飾“深度思維”公司對“阿爾法狗”巨大成就的激動,但更看重的是,這一成就是基於直接運用數據的機器學習原理。團隊從中獲得的啟示是:這種學習方法不僅能夠利用可獲得的人類數據進行學習,甚至更為明顯的是直接利用增強價值學習,而且這種直接利用學習經驗的學習方式效果或許更好。
展望未來,席爾瓦表示,“阿爾法狗”擁有基於神經網路和樹搜索運算的強大數據分析、學習能力,以及作出決策的綜合考量系統,這使它具有非常廣闊的潛在應用前景。目前“深度思維”團隊已開始與英國國家醫療服務體系開展合作。憑藉海量數據分析能力,“阿爾法狗”未來在醫療領域將很可能會扮演“醫生”的角色,與傳統醫生相比,它能夠利用患者個人病史和具體症狀等大量數據,作出更加準確的診斷。此外,在金融、智慧機器人、智慧手機助手和環境監測等諸多領域,“阿爾法狗”未來都有可能大顯身手。
近年來人工智慧的迅猛發展,引發了包括著名物理學家史蒂芬·霍金在內的很多人的擔憂。對此席爾瓦向科技日報記者表示,人工智慧始終以服務於人類為目的,他對人工智慧的未來非常樂觀。
(科技日報倫敦3月31日電)
- 股票名稱 最新價 漲跌幅