上個(gè)月,OpenAI 發(fā)布其最新語(yǔ)言模型——GPT-2,但因?yàn)閾?dān)心它可能被用來(lái)制造大量偽造和虛假的信息,頗為戲劇性地決定不開(kāi)源該模型。
這一決定也使得 AI 社區(qū)開(kāi)始討論:如何檢測(cè)這類(lèi)虛假新聞。
在一項(xiàng)新實(shí)驗(yàn)中,來(lái)自麻省理工學(xué)院-IBM Watson 人工智能實(shí)驗(yàn)室和哈佛大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室的研究人員思考,能夠生成如此逼真的文本的語(yǔ)言模型,是否可以用來(lái)檢測(cè)其他語(yǔ)言模型生成的文本的真假。
圖 丨 OpenAI GPT-2 生成的假新聞。(來(lái)源:HENDRIK STROBELT AND SEBASTIAN GEHRMANN)
這個(gè)假設(shè)背后的想法很簡(jiǎn)單:語(yǔ)言模型通過(guò)不斷預(yù)測(cè)單詞序列中的下一個(gè)概率最大的單詞來(lái)產(chǎn)生句子。因此,如果某個(gè)語(yǔ)言模型能夠輕松地預(yù)測(cè)某一段落中的大部分詞語(yǔ),那這段文本很可能就是這個(gè)語(yǔ)言模型生成的。
研究人員通過(guò)構(gòu)建基于 OpenAI GPT-2 開(kāi)源的小模型的交互式工具來(lái)測(cè)試他們的想法。當(dāng)為該工具提供一段文字時(shí),它會(huì)讓每個(gè)單詞高亮不同的顏色,從綠色到黃色到紅色,表示預(yù)測(cè)幾率逐漸下降;如果語(yǔ)言模型根本沒(méi)有預(yù)測(cè)出某一單詞,它會(huì)用紫色高亮該單詞。所以從理論上講,紅色和紫色詞的越多,該文本由人類(lèi)書(shū)寫(xiě)的概率就越大;如果綠色和黃色詞的份額越大,該文本由語(yǔ)言模型生成的概率就越大。
圖 丨 OpenAI GPT-2 小模型生成的文本。(來(lái)源:HENDRIK STROBELT AND SEBASTIAN GEHRMANN)
事實(shí)上,研究人員發(fā)現(xiàn),GPT-2 的小模型和完整版本的模型所寫(xiě)的段落幾乎完全是綠色和黃色,而人類(lèi)寫(xiě)的科學(xué)文摘和美國(guó)入學(xué)標(biāo)準(zhǔn)化測(cè)試中閱讀理解段落中的文字有很多紅色和紫色。
圖 丨 美國(guó)入學(xué)標(biāo)準(zhǔn)化測(cè)試中的閱讀理解短文,由人類(lèi)書(shū)寫(xiě)。(來(lái)源:HENDRIK STROBELT AND SEBASTIAN GEHRMANN)
但事情沒(méi)有想象中的簡(jiǎn)單。Janelle Shane 是一位負(fù)責(zé)運(yùn)營(yíng)“Letting Neural Networks Be Weird“博客的研究員,她并未參與前文所述的研究。她將該工具用于更嚴(yán)格的測(cè)試,不僅僅提供 GPT-2 生成的文本,還提供了由其他語(yǔ)言模型生成的文本,包括一個(gè)用亞馬遜評(píng)論訓(xùn)練的模型和一個(gè)用《龍與地下城》語(yǔ)料訓(xùn)練的模型。
她發(fā)現(xiàn),這個(gè)工具無(wú)法預(yù)測(cè)每個(gè)段落中的大部分單詞,因此該工具認(rèn)為這些文本是人類(lèi)寫(xiě)的。這說(shuō)明一個(gè)重要觀點(diǎn):語(yǔ)言模型可能擅長(zhǎng)檢測(cè)自己的輸出,但不一定擅長(zhǎng)檢測(cè)其他語(yǔ)言模型的輸出。
看來(lái),人類(lèi)打擊互聯(lián)網(wǎng)假新聞還是任重道遠(yuǎn)啊。
-
互聯(lián)網(wǎng)
+關(guān)注
關(guān)注
55文章
11251瀏覽量
106416 -
AI
+關(guān)注
關(guān)注
88文章
35147瀏覽量
279830
原文標(biāo)題:假新聞AI也可用于檢測(cè)消息真假,你信嗎?
文章出處:【微信號(hào):lianggezhizi,微信公眾號(hào):兩個(gè)質(zhì)子】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
【BPI-CanMV-K230D-Zero開(kāi)發(fā)板體驗(yàn)】AI 算法模型(人臉檢測(cè)、軀干檢測(cè)、車(chē)牌識(shí)別)
【BPI-CanMV-K230D-Zero開(kāi)發(fā)板體驗(yàn)】03 攝像頭調(diào)用+AI人臉檢測(cè)
適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)
AI智能質(zhì)檢系統(tǒng) 工業(yè)AI視覺(jué)檢測(cè)


工業(yè)AI視覺(jué)檢測(cè)項(xiàng)目實(shí)施第四步:工廠驗(yàn)收

汽車(chē)行業(yè)AI視覺(jué)檢測(cè)(下):創(chuàng)新驅(qū)動(dòng)品質(zhì)提升

AI干貨補(bǔ)給站04 | 工業(yè)AI視覺(jué)檢測(cè)項(xiàng)目實(shí)施第三步:模型構(gòu)建

直播報(bào)名丨第4講:AI檢測(cè)系統(tǒng)落地工具詳解

AI干貨補(bǔ)給站03 | 工業(yè)AI視覺(jué)檢測(cè)項(xiàng)目實(shí)施第二步:數(shù)據(jù)收集

直播報(bào)名丨第2講:熱門(mén)AI檢測(cè)案例解析

AI學(xué)堂首播丨一節(jié)課詳解AI檢測(cè)系統(tǒng)開(kāi)發(fā)全流程

基于AI的異常檢測(cè)解決方案
使用TI Edge AI Studio和AM62A進(jìn)行基于視覺(jué)AI的缺陷檢測(cè)

ai煙火檢測(cè)解決方案

評(píng)論