科技日?qǐng)?bào)記者 張夢(mèng)然
據(jù)最新一期《自然》雜志發(fā)表的一篇論文,谷歌深度思維團(tuán)隊(duì)報(bào)告了一種能為大語(yǔ)言模型生成文本添加水印的工具,可提高對(duì)合成內(nèi)容的鑒別和追溯能力。
大語(yǔ)言模型(LLM)是廣泛使用的人工智能(AI)工具,能為聊天機(jī)器人、文章寫(xiě)作和其他目的生成文本。不過(guò),人們很難識(shí)別并追溯AI生成文本的來(lái)源,使信息的可靠性受到質(zhì)疑。水印被認(rèn)為能解決這一問(wèn)題,但生產(chǎn)系統(tǒng)對(duì)質(zhì)量和計(jì)算效率的嚴(yán)格要求阻礙了其規(guī)?;瘧?yīng)用。
深度思維團(tuán)隊(duì)此次利用一種全新采樣算法,開(kāi)發(fā)出一個(gè)給AI生成文本添加水印的系統(tǒng),稱(chēng)為SynthID-Text。該工具通過(guò)采樣算法對(duì)LLM的詞匯選擇進(jìn)行巧妙偏移,插入一個(gè)能被相關(guān)檢測(cè)軟件識(shí)別的簽名。這既可以通過(guò)一種“扭曲”路徑實(shí)現(xiàn)——該路徑能提高水印質(zhì)量但會(huì)輕微影響輸出質(zhì)量,也可以通過(guò)一種能保留文本質(zhì)量的“非扭曲”路徑實(shí)現(xiàn)。
深度思維已在多個(gè)公開(kāi)模型上評(píng)估了這些水印的可檢測(cè)性,發(fā)現(xiàn)SynthID-Text的可檢測(cè)性?xún)?yōu)于當(dāng)前其他方法。他們還用Gemini LLM的近2000萬(wàn)次在線對(duì)話(huà),評(píng)估了這些文本的質(zhì)量,結(jié)果顯示非扭曲水印形式不會(huì)降低文本質(zhì)量。此外,使用SynthID-Text對(duì)LLM運(yùn)行所需算力的影響可忽略不計(jì),減少了應(yīng)用上的障礙。
團(tuán)隊(duì)同時(shí)提醒道,編輯文本或改寫(xiě)輸出就能避免出現(xiàn)文本水印。但該研究證明,一個(gè)為AI生成內(nèi)容的生成式文本添加水印的工具是可行的,其將提高AI使用的責(zé)任和透明度。