據近日發表在預印本伺服器bioRxiv上的一項研究,人工智慧(AI)聊天機器人ChatGPT已可寫出令人信服的假研究論文摘要,甚至連審稿科學家也無法發現。
聊天機器人ChatGPT會根據用戶提示創建逼真文本,它通過消化大量現有的人類生成文本來學習執行任務。美國的軟體公司OpenAI于去年11月發佈了該工具,並供用戶免費使用。
自發佈以來,研究人員一直在努力解決相關倫理道德問題,因為它大部分輸出可能很難與人類撰寫的文本區分開來。近日美國西北大學的一個研究小組使用ChatGPT生成人工研究論文摘要,以測試科學家是否可辨別它們。
研究人員要求機器人基於發表在《美國醫學會雜誌》《新英格蘭醫學雜誌》《英國醫學雜誌》《柳葉刀》和《自然·醫學》上的50篇研究編寫摘要。然後,他們通過抄襲檢測器和AI輸出檢測器將這些摘要與原始摘要進行比較,並要求一組醫學研究人員找出編造的摘要。
結果,ChatGPT生成的摘要通過了抄襲檢查器,原創性得分中位數為100%,表明沒有檢測到抄襲。人工智慧輸出檢測器發現了66%的生成摘要,但人工審稿人只正確識別了68%的生成摘要和86%的真實摘要,他們錯誤地將生成摘要中的32%識別為真實,將14%的真實摘要識別為編造。
研究人員稱,ChatGPT寫出了能騙過人類的科學摘要,如果科學家無法確定研究是否屬實,或會産生“可怕的後果”。
研究人員表示,在虛假資訊會危及人們生命安全的醫學等領域,期刊需要採取更嚴格的方法來驗證資訊的準確性。而這些問題的解決方案,不應集中在機器人本身,“而是導致這種行為的不正當激勵措施,例如通過論文數量進行招聘和晉陞審查,而不考慮其品質或影響”。
【總編輯圈點】
大火的ChatGPT,不止是聊天工具,它在教育領域的滲透已經引起了廣泛關注和討論,當然,隨之而來的還有憂慮。如果你使用過ChatGPT,也會驚訝于它撰寫報告的能力。給它一個主題,它就能在幾秒內生成大綱,也能在幾秒內進行細化,而且看起來非常是那麼回事。這次,科研人員發現它撰寫的論文甚至能騙過審稿人。這又是一個人如何使用新技術的經典倫理問題。工具本身無罪,但應用邊界應該清晰,使用者也要對自己的行為負起責任。