苦於缺乏談判技巧的人們,或許未來可以求助於人工智慧(AI)了。英國《自然·通訊》雜誌6日報告,“深度思維”公司研發的一種“AI代理”會談判並能達成協定,其已在測試平台中勝過其他無此能力的代理。這一成果展示了一種深度強化學習方法,用其建模的“AI代理”可與其他人工代理溝通合作,在玩遊戲時共同制定計劃。
開發能展現出代理間合作和溝通的AI十分重要。流行桌面遊戲《外交》為此類行為提供了有用的測試平臺,它包含玩家之間複雜的溝通、談判和形成同盟,而AI一直很難達成這些。要贏得遊戲,《外交》需要推斷在場玩家的未來計劃、玩家間的承諾,和他們的誠實合作。過去的“AI代理”在單個玩家或兩個競爭性玩家的遊戲中取得過成功,其中玩家之間沒有交流。
英國“深度思維”研究團隊此次設計了一種深度強化學習方法,讓代理可以協商同盟、共同制定計劃。研究人員創造出了模擬玩家的代理,形成團隊,嘗試勝過其他隊伍的策略。通過預測可能的未來遊戲狀態,這一學習演算法允許代理對未來行動達成一致,識別有益交易。為接近人類水準的表現,他們還通過檢驗一些代理間承諾破裂的場景(代理背離了過去的協議),調查了誠實合作的條件。
這些成果有助於“AI代理”形成靈活溝通機制,使其能根據環境調整策略。此外,這些發現還表明,對違反協議的同伴的制裁傾向會大大降低這類違反者的優勢,有助於形成大多可信的交流,儘管情況最初更有利於違反協議者。
我們現在也常會跟AI打交道。它熱情洋溢、語調輕快地推銷商品,介紹活動,提供售後服務。不過,通常情況下我們很快就能發現電話那頭的是AI。它很難靈活變通,也回答不了超出設置之外的問題。在“深度思維”公司的這項研究中,AI已經能上談判桌了。它們不僅會審時度勢,還會合縱連橫,並懲罰談判上的不可信者。當然,人類不可能放心直接讓AI談判,但這類嘗試可以讓AI形成靈活溝通機制,從而增進它們在其他許多領域的表現。