深度思維能為AI生成文本“打水印”

2024-10-26 01:25:00 來(lái)源: 科技日?qǐng)?bào) 點(diǎn)擊數(shù)：

科技日?qǐng)?bào)記者張夢(mèng)然

據(jù)最新一期《自然》雜志發(fā)表的一篇論文，谷歌深度思維團(tuán)隊(duì)報(bào)告了一種能為大語(yǔ)言模型生成文本添加水印的工具，可提高對(duì)合成內(nèi)容的鑒別和追溯能力。

大語(yǔ)言模型（LLM）是廣泛使用的人工智能（AI）工具，能為聊天機(jī)器人、文章寫(xiě)作和其他目的生成文本。不過(guò)，人們很難識(shí)別并追溯AI生成文本的來(lái)源，使信息的可靠性受到質(zhì)疑。水印被認(rèn)為能解決這一問(wèn)題，但生產(chǎn)系統(tǒng)對(duì)質(zhì)量和計(jì)算效率的嚴(yán)格要求阻礙了其規(guī)?；瘧?yīng)用。

深度思維團(tuán)隊(duì)此次利用一種全新采樣算法，開(kāi)發(fā)出一個(gè)給AI生成文本添加水印的系統(tǒng)，稱(chēng)為SynthID-Text。該工具通過(guò)采樣算法對(duì)LLM的詞匯選擇進(jìn)行巧妙偏移，插入一個(gè)能被相關(guān)檢測(cè)軟件識(shí)別的簽名。這既可以通過(guò)一種“扭曲”路徑實(shí)現(xiàn)——該路徑能提高水印質(zhì)量但會(huì)輕微影響輸出質(zhì)量，也可以通過(guò)一種能保留文本質(zhì)量的“非扭曲”路徑實(shí)現(xiàn)。

深度思維已在多個(gè)公開(kāi)模型上評(píng)估了這些水印的可檢測(cè)性，發(fā)現(xiàn)SynthID-Text的可檢測(cè)性?xún)?yōu)于當(dāng)前其他方法。他們還用Gemini LLM的近2000萬(wàn)次在線對(duì)話(huà)，評(píng)估了這些文本的質(zhì)量，結(jié)果顯示非扭曲水印形式不會(huì)降低文本質(zhì)量。此外，使用SynthID-Text對(duì)LLM運(yùn)行所需算力的影響可忽略不計(jì)，減少了應(yīng)用上的障礙。

團(tuán)隊(duì)同時(shí)提醒道，編輯文本或改寫(xiě)輸出就能避免出現(xiàn)文本水印。但該研究證明，一個(gè)為AI生成內(nèi)容的生成式文本添加水印的工具是可行的，其將提高AI使用的責(zé)任和透明度。

責(zé)任編輯：常麗君

熱點(diǎn)