一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AIGC時代的ImageNet!百萬生成圖片助力AI生成圖片檢測器研發(fā)

CVer ? 來源:CVer ? 2023-07-04 15:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1 引言:

在這個AIGC爆發(fā)的時代,人人都可以利用AI算法生成高質(zhì)量的文本,圖像,音頻內(nèi)容。其中,由Midjourney, Stable Diffusion等圖像生成方法制作的圖像,其逼真程度讓人贊嘆。人眼已經(jīng)難以對其真假進(jìn)行區(qū)分了。這不禁喚起了人們的隱憂:大量虛假圖片將會在互聯(lián)網(wǎng)上廣泛傳播。虛假圖片的泛濫會引發(fā)多種社會安全問題。例如,虛假新聞會擾亂社會秩序,混淆視聽。惡意的人臉圖片造假則會引發(fā)金融欺詐,造成信任危機(jī)。例如,下圖為Midjourney生成的特朗普被捕圖片。這類圖片在社交媒體上廣泛傳播,對政治領(lǐng)域造成了不良影響。因此,對這些AI生成的圖像進(jìn)行有效監(jiān)管是非常有必要的。

cc0de970-1828-11ee-962d-dac502259ad0.jpg

圖2 AI生成的特朗普被捕圖片,來源于https://news.sina.com.cn/c/2023-04-15/doc-imyqmchz0199110.shtml

考慮到人眼已經(jīng)難以對真假圖片進(jìn)行區(qū)分,我們急需一種AI生成圖像檢測器以區(qū)分AI制作的圖像和真實的圖像。然而,現(xiàn)在大規(guī)模數(shù)據(jù)集的缺失妨礙了檢測器的開發(fā)。因此,我們提出了百萬量級的GenImage數(shù)據(jù)集,致力于構(gòu)建AIGC時代的ImageNet。

2 數(shù)據(jù)集介紹:

cc65a674-1828-11ee-962d-dac502259ad0.jpg

表1 虛假圖片檢測數(shù)據(jù)集概覽

過去業(yè)界也有推出一些數(shù)據(jù)集。他們主要有三個特點。第一個是數(shù)據(jù)規(guī)模小,第二個是都是基于GAN的,第三個是局限于人臉數(shù)據(jù)。隨著時間推移,數(shù)據(jù)規(guī)模慢慢地在增加,生成器也從GAN時代過渡到Diffusion時代,數(shù)據(jù)的范圍也在增加。但是一個大規(guī)模的,以Diffusion模型為主的,涵蓋各類通用圖像的數(shù)據(jù)集仍然是缺失的。

基于此,我們提出一個對標(biāo)imagenet的genimage數(shù)據(jù)集。真實的圖片采用了ImageNet。虛假的圖片采用ImageNet的標(biāo)簽進(jìn)行生成。我們利用了八個先進(jìn)的生成器來生成,分別是Midjourney, Stable Diffusion V1.4, Stable Diffusion V1.5, ADM, GLIDE, Wukong,VQDM和BigGAN。這些生成器生成的圖片總數(shù)基本與真實圖片一致。每個生成器生成的圖片數(shù)量也基本一致。每一類生成的圖片數(shù)量基本一致。

這個數(shù)據(jù)集具有以下優(yōu)勢:

1. 大量的數(shù)據(jù):超過百萬對圖片對。

2. 豐富的圖片內(nèi)容:利用ImageNet進(jìn)行構(gòu)建,具有豐富的標(biāo)簽
3. 先進(jìn)的生成器:覆蓋Midjourney, Stable Diffusion等Diffusion生成器。

在真實世界中檢測器往往會遇到各種各樣的困難。我們經(jīng)過實驗發(fā)現(xiàn),檢測器往往在兩種情況下性能下降嚴(yán)重。第一種是面對訓(xùn)練集中未出現(xiàn)的生成器生成的圖片時。第二種是面對退化的圖像。例如,CNNSpot在Stable Diffusion V1.4上訓(xùn)練后,在Midjourney上測試僅有52.8的準(zhǔn)確率。當(dāng)訓(xùn)練和測試生成器同為Stable Diffusion V1.4,在面對模糊的圖像時,CNNSpot準(zhǔn)確率僅僅為77.9。基于此,我們在這個數(shù)據(jù)集基礎(chǔ)上對檢測器提出兩個挑戰(zhàn):

1. 交叉生成器:檢測器在一種生成器生成的數(shù)據(jù)上訓(xùn)練,在其他生成器生成的數(shù)據(jù)上驗證。這個任務(wù)目的是考察檢測器在不同生成器上的泛化能力。

2. 退化圖像識別:檢測器需要對于低分辨率,模糊和壓縮圖像進(jìn)行識別。這個任務(wù)主要考察檢測器在真實條件(如互聯(lián)網(wǎng)上傳播)中面對低質(zhì)量圖像時的泛化問題。

我們相信這個數(shù)據(jù)集的提出將大大有助于人們開發(fā)AI生成圖片檢測器。

3 實驗:

我們做了一些實驗來考察這個數(shù)據(jù)集,我們發(fā)現(xiàn)在某個生成器上訓(xùn)練的ResNet-50模型在其他的測試準(zhǔn)確率會明顯降低。然而在真實情況下我們難以得知遇到的圖像的生成器是什么。因此檢測器對于不同生成器生成圖片的泛化能力很重要。

cc9d592a-1828-11ee-962d-dac502259ad0.jpg

表2 使用ResNet 50在不同生成器上交叉驗證

我們對比了現(xiàn)有方法在Stable Diffusion V1.4上訓(xùn)練,然后在各種生成器上測試的結(jié)果,見圖3。我們也評測了各種生成器上訓(xùn)練,然后在各種生成器上測試的結(jié)果。見圖4。圖4中,Testing Subset那一列中的每一個數(shù)據(jù)點,都是在八個生成器上訓(xùn)練,然后在一個生成器上測試得到的平均結(jié)果。然后我們將這些測試集上的結(jié)果平均,得到最右側(cè)的平均結(jié)果。

cccf86d4-1828-11ee-962d-dac502259ad0.jpg

表3 在Stable Diffusion V1.4上訓(xùn)練,不同測試集上測試

cce87dce-1828-11ee-962d-dac502259ad0.jpg

表4 在不同生成器上訓(xùn)練,不同測試集上測試

我們對測試集進(jìn)行退化處理,采用不同參數(shù)下的低分辨率,JPEG壓縮和高斯模糊,評測結(jié)果如下

cd47e6b0-1828-11ee-962d-dac502259ad0.jpg

表5 在不同退化圖像上驗證結(jié)果

那么采集這么多數(shù)據(jù)是不是有用呢?我們做了相關(guān)實驗,證明通過提升數(shù)據(jù)類比和每類的圖片數(shù)量,我們是可以提高性能的。

cd8a9c3a-1828-11ee-962d-dac502259ad0.jpg

表6 提升圖片數(shù)量的結(jié)果

針對GenImage數(shù)據(jù)集對于不同圖片的泛化能力,我們發(fā)現(xiàn)他對于人臉和藝術(shù)類圖片也能達(dá)到很好的效果。

cdb835f0-1828-11ee-962d-dac502259ad0.jpg

表7 泛化到藝術(shù)類和人臉類圖片的結(jié)果

cdf037de-1828-11ee-962d-dac502259ad0.jpg

圖3 測試所用的藝術(shù)類和人臉類圖片展示

4 展望

隨著AI生成圖片能力的不斷提升,對于AI生成的圖片實現(xiàn)有效檢測的需求將會越來越迫切。本數(shù)據(jù)集致力于為真實環(huán)境下的生成圖片檢測提供有效訓(xùn)練數(shù)據(jù)。我們使用ResNet-50在本數(shù)據(jù)集中訓(xùn)練,然后在真實推文中進(jìn)行檢測。如下圖4,ResNet-50能夠有效識別真圖和假圖。這個結(jié)果證明了GenIamge可以用于訓(xùn)練模型以判別真實世界的虛假信息。我們認(rèn)為,該領(lǐng)域未來值得努力的方向是不斷提升檢測器在GenImage數(shù)據(jù)集上的準(zhǔn)確率,并進(jìn)而提升其在真實世界面對虛假信息的能力。

ce1fd2a0-1828-11ee-962d-dac502259ad0.jpg

圖4.1 真實推文展示(真圖)

ce5e4cd8-1828-11ee-962d-dac502259ad0.jpg

圖4.2 真實推文展示(假圖)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 檢測器
    +關(guān)注

    關(guān)注

    1

    文章

    894

    瀏覽量

    48725
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25463
  • AIGC
    +關(guān)注

    關(guān)注

    1

    文章

    388

    瀏覽量

    2494

原文標(biāo)題:AIGC時代的ImageNet!百萬生成圖片助力AI生成圖片檢測器研發(fā)

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Copilot操作指南(一):使用圖片生成原理圖符號、PCB封裝

    的操作方法。? ” ? 圖片生成原理圖符號(Symbol) Copilot 支持圖片生成原理圖符號功能,支持原理圖編輯與符號編輯
    的頭像 發(fā)表于 07-15 11:14 ?1070次閱讀
    Copilot操作指南(一):使用<b class='flag-5'>圖片</b><b class='flag-5'>生成</b>原理圖符號、PCB封裝

    LABVIEW怎么生成圖片,然后調(diào)用圖片?

    ,然后把這個圖片保存起來,以便別的地方調(diào)用。六個輸入項中,第一個是分類選擇,因為這種分子式結(jié)構(gòu)一共有6類。1.第一個的分類選擇,是為了選結(jié)構(gòu)形式,如下一共有六種:2.選擇完參數(shù)后 生成圖片如下:3.把
    發(fā)表于 12-08 11:21

    改進(jìn)的基于混沌理論的檢測器生成算法

    為提高抗體的生成速度,依據(jù)人工免疫系統(tǒng)的混沌特性,提出一種基于混沌方法的新的檢測器生成算法,利用混沌的遍歷性,并結(jié)合信息論中熵的概念來產(chǎn)生均勻的初始檢測器集合,利
    發(fā)表于 12-25 12:45 ?17次下載

    基于VC++的生成公章圖片的簡易工具

    學(xué)習(xí)VC也沒多久,將我做的這個小工具和大家分享一下。其主要功能就是可以自定義生成公章圖形并保存為bmp圖片,希望對大家有點用。具體實現(xiàn)的方法如下: 步驟一:生成
    發(fā)表于 10-29 11:56 ?19次下載

    DTFM信號生成檢測?(2)

    本文介紹DTFM信號生成檢測之二,DTMF檢測器實現(xiàn)。
    發(fā)表于 03-11 13:15 ?1517次閱讀
    DTFM信號<b class='flag-5'>生成</b>與<b class='flag-5'>檢測</b>?(2)

    16、24、32全套字庫圖片生成應(yīng)用程序軟件免費下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是16、24、32全套字庫圖片生成應(yīng)用程序軟件免費下載。
    發(fā)表于 09-19 16:04 ?19次下載
    16、24、32全套字庫<b class='flag-5'>圖片</b><b class='flag-5'>生成</b>應(yīng)用程序軟件免費下載

    電子印章圖片生成器的應(yīng)用程序免費下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是電子印章圖片生成器的應(yīng)用程序免費下載。
    發(fā)表于 07-03 08:00 ?348次下載
    電子印章<b class='flag-5'>圖片</b><b class='flag-5'>生成</b>器的應(yīng)用程序免費下載

    如何使用TensorFlow Hub的ESRGAN模型來在安卓app中生成超分圖片

    從一張低分辨率的圖片生成一張對應(yīng)的高分辨率圖片的任務(wù)通常被稱為單圖超分(Single Image Super Resolution - SISR)。盡管可以使用傳統(tǒng)的插值方法(如雙線性
    的頭像 發(fā)表于 11-26 09:40 ?3812次閱讀

    條件生成對抗模型生成數(shù)字圖片的教程

    這次我們在上次的例子中在提升一下,這次我們選用條件生成對抗模型(Conditional Generative Adversarial Networks)來生成數(shù)字圖片。
    的頭像 發(fā)表于 12-10 18:36 ?1029次閱讀

    GTC 2023主題直播:使用Picasso服務(wù)構(gòu)建圖片和視頻生成式模型

    我們很高興Getty Images將使用Picasso服務(wù)構(gòu)建Edify圖片和Edify視頻生成式模型。
    的頭像 發(fā)表于 03-22 11:31 ?1050次閱讀
    GTC 2023主題直播:使用Picasso服務(wù)構(gòu)建<b class='flag-5'>圖片</b>和視頻<b class='flag-5'>生成</b>式模型

    智慧有數(shù) 浪潮信息發(fā)布生成AI存儲解決方案

    與管理瓶頸,浪潮信息在"數(shù)智未來"AIGC數(shù)據(jù)應(yīng)用創(chuàng)新論壇上,正式發(fā)布面向生成AI的存儲解決方案,該方案以極致融合、極致性能、極致節(jié)能,和熱溫冷冰四級數(shù)據(jù)全生命周期管理,助力開啟
    的頭像 發(fā)表于 07-11 09:46 ?599次閱讀

    IBM 謝東:IBM watsonx 助力生成AI 的企業(yè)應(yīng)用

    ,企業(yè)在探索利用生成AI 促進(jìn)自身業(yè)務(wù)發(fā)展時所面臨的挑戰(zhàn)以及應(yīng)對措施。 以下是他的發(fā)言摘要: IBM 全球副總裁、IBM 大中華區(qū)首席技術(shù)官 謝東 (圖片來源:2023 中國 AIGC
    的頭像 發(fā)表于 09-06 18:20 ?875次閱讀
    IBM 謝東:IBM watsonx <b class='flag-5'>助力</b><b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 的企業(yè)應(yīng)用

    AIGC與傳統(tǒng)內(nèi)容生成的區(qū)別

    AIGC(Artificial Intelligence Generated Content,人工智能生成內(nèi)容)與傳統(tǒng)內(nèi)容生成在多個方面存在顯著區(qū)別。以下是對這兩者的對比: 一、數(shù)據(jù)類型與處理
    的頭像 發(fā)表于 10-25 15:13 ?1268次閱讀

    AIGC生成內(nèi)容的優(yōu)勢與挑戰(zhàn)

    人工智能生成內(nèi)容(AIGC,Artificial Intelligence Generated Content)是指利用人工智能技術(shù)自動生成文本、圖像、音頻和視頻等內(nèi)容的過程。隨著深度學(xué)習(xí)、自然語言
    的頭像 發(fā)表于 10-25 15:36 ?1804次閱讀

    AIGC與傳統(tǒng)內(nèi)容生成的區(qū)別 AIGC的優(yōu)勢和挑戰(zhàn)

    AIGC(Artificial Intelligence Generated Content,生成內(nèi)容)與傳統(tǒng)內(nèi)容生成在多個方面存在顯著區(qū)別,同時AIGC也展現(xiàn)出其獨特的優(yōu)勢和面臨的挑
    的頭像 發(fā)表于 11-22 16:04 ?1444次閱讀