谷歌旗下“深層思維”公司的研究人員設計了一種“浮水印”,可以無形地標記人工智慧生成的文本,並將其提供給數百萬聊天機器人用戶。該研究成果日前發表在英國《自然》雜誌上。
隨著大語言模型在品質、連貫性、覆蓋範圍和專業性方面的進步,區分其生成的高品質合成文本和人工書寫文本變得越來越困難。鋻於大語言模型在教育、軟體開發和網路內容生成中的廣泛使用,人工智慧生成文本的識別和歸屬對於確保安全和負責任使用該技術至關重要。
各國都希望通過浮水印來識別人工智慧生成文本並限制意外或故意濫用問題,以幫助鑒別和打擊虛假新聞和學術造假等,同時避免因使用人工智慧生成內容訓練而導致未來模型品質下降的問題。但迄今開發的浮水印都較容易被移除,或者用於欺詐。
此前,“深層思維”公司已經開發出圖像浮水印技術——SynthID,可以識別並應用在人工智慧生成圖像上。在此基礎上該公司開發了一種被稱為SynthID-Text的文本浮水印技術,可以將浮水印應用於文本。
該技術將浮水印整合到大語言模型本身文本生成的步驟中,以一種隱秘但公式化的方式標記模型選擇的單詞,而這可以用密鑰檢測到。與其他方法相比,這樣産生的浮水印更容易被檢測到,而且應用它不會減慢文本的生成速度和品質。此外,由於密鑰複雜,移除浮水印或使用浮水印欺詐變得更加困難,即使使用第二個大語言模型來解釋文本,浮水印仍然可以被檢測到。
目前,“深層思維”公司已將該浮水印技術開源,開發人員可以將這種浮水印應用於他們的模型。
(責任編輯:沈曄)