“AI代理”會談判能達成協定

發佈時間：2022-12-07 14:20:17 | 來源：科技日報 | 作者：張夢然 | 責任編輯：徐麗麗

苦於缺乏談判技巧的人們，或許未來可以求助於人工智慧（AI）了。英國《自然·通訊》雜誌6日報告，“深度思維”公司研發的一種“AI代理”會談判並能達成協定，其已在測試平台中勝過其他無此能力的代理。這一成果展示了一種深度強化學習方法，用其建模的“AI代理”可與其他人工代理溝通合作，在玩遊戲時共同制定計劃。

開發能展現出代理間合作和溝通的AI十分重要。流行桌面遊戲《外交》為此類行為提供了有用的測試平臺，它包含玩家之間複雜的溝通、談判和形成同盟，而AI一直很難達成這些。要贏得遊戲，《外交》需要推斷在場玩家的未來計劃、玩家間的承諾，和他們的誠實合作。過去的“AI代理”在單個玩家或兩個競爭性玩家的遊戲中取得過成功，其中玩家之間沒有交流。

英國“深度思維”研究團隊此次設計了一種深度強化學習方法，讓代理可以協商同盟、共同制定計劃。研究人員創造出了模擬玩家的代理，形成團隊，嘗試勝過其他隊伍的策略。通過預測可能的未來遊戲狀態，這一學習演算法允許代理對未來行動達成一致，識別有益交易。為接近人類水準的表現，他們還通過檢驗一些代理間承諾破裂的場景（代理背離了過去的協議），調查了誠實合作的條件。

這些成果有助於“AI代理”形成靈活溝通機制，使其能根據環境調整策略。此外，這些發現還表明，對違反協議的同伴的制裁傾向會大大降低這類違反者的優勢，有助於形成大多可信的交流，儘管情況最初更有利於違反協議者。

我們現在也常會跟AI打交道。它熱情洋溢、語調輕快地推銷商品，介紹活動，提供售後服務。不過，通常情況下我們很快就能發現電話那頭的是AI。它很難靈活變通，也回答不了超出設置之外的問題。在“深度思維”公司的這項研究中，AI已經能上談判桌了。它們不僅會審時度勢，還會合縱連橫，並懲罰談判上的不可信者。當然，人類不可能放心直接讓AI談判，但這類嘗試可以讓AI形成靈活溝通機制，從而增進它們在其他許多領域的表現。

[列印] [收藏] [發表評論]

分享到: