一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像生成領(lǐng)域的一個巨大進(jìn)展,BigGAN的效果真的有那么好嗎?

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-11-21 09:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編者按:今年國慶期間,論智介紹了當(dāng)時(shí)正處于ICLR 2019盲審階段的一篇論文:BigGAN。這是赫瑞-瓦特大學(xué)和DeepMind研究人員的合作成果,根據(jù)實(shí)驗(yàn)結(jié)果,他們把模型IS提高了一百多分——從52.52提升到了166.3——堪稱圖像生成領(lǐng)域的一個巨大進(jìn)展。但大家都知道,通常論文里呈現(xiàn)的圖像都是精品中的精品,媒體在宣傳時(shí)也會盡量美化甚至“神化”結(jié)果。那么BigGAN的效果真的有那么好嗎?

當(dāng)我第一次看到這些圖像時(shí),說實(shí)話我很驚訝。不是因?yàn)閳D像本身潛藏著什么內(nèi)容,而是它們都是一個叫BigGAN的神經(jīng)網(wǎng)絡(luò)生成的,都是假的,我還從來沒見過這樣宛若照片的生成圖像。

上面這8幅圖截自BigGAN的論文:Large Scale GAN Training for High Fidelity Natural Image Synthesis(arXiv:1809.11096),感興趣的讀者可以去讀一讀。幾個月前,這篇論文在機(jī)器學(xué)習(xí)社區(qū)引起了巨大轟動,它不僅能生成512x512的高分辨率圖像,還在Inception標(biāo)準(zhǔn)基準(zhǔn)測試中取得了歷史性的高分。人們在驚異于論文團(tuán)隊(duì)能支撐起的龐大處理能力(512 TPUv3)的同時(shí),也不由心生懷疑:BigGAN是不是作弊了?它是不是直接照搬的訓(xùn)練集圖像?

為此,不少研究人員去原始ImageNet檢驗(yàn)了自己的想法,然而他們最終得出的結(jié)論是:這些圖像確實(shí)都是BigGAN自己生成的。

雖然前人的做法已經(jīng)證實(shí)BigGAN是“誠實(shí)”的,但如果我們再“杠”一下,一個合理的懷疑是論文結(jié)果之所以令人印象深刻,一個原因是這都是精選后的圖像。就在幾天前,BigGAN放出了自己的TF Hub Demo,相信不少人已經(jīng)去體驗(yàn)過了,也發(fā)現(xiàn)這個問題。模型在一些常見物品上的表現(xiàn)非常好,比如狗和簡單風(fēng)景,因?yàn)樗鼈兺嬅鎲我?、結(jié)構(gòu)簡單,但在生成更復(fù)雜、更多樣的的人群上卻很糟糕。

那么BigGAN不完美的一面是什么樣的呢?下面是研究人員發(fā)布的一些生成圖像:

毫無疑問,這三幅圖展示的都是時(shí)鐘,但區(qū)別于現(xiàn)實(shí)中的實(shí)物,這些鐘更像人夢里的場景:詭異的字母、多余的指針。負(fù)責(zé)任的說,這些是BigGAN生成圖像中的常見問題,它不能學(xué)習(xí)數(shù)據(jù)集里的各種字母和字符,再加上GAN本身不提供計(jì)數(shù)功能,所以我們經(jīng)常能在里面發(fā)現(xiàn)有很多條腿的蜘蛛和眼睛長太多的青蛙,有時(shí)還可以看到有兩個火車頭的火車。

至于人類……相比其他能生成多樣性圖像的GAN,BigGAN在生成人類圖像上其實(shí)已經(jīng)很不錯了。但我們是人,很擅長在這個物種的臉上、軀體上發(fā)現(xiàn)“丟失”部分,所以下面這些結(jié)果還是很令人頭疼。

因此,如果快速瀏覽BigGAN生成的一系列圖像,我們能從中發(fā)現(xiàn)不少圖具有詭異的美感。比如模型在生成下面幾幅景觀圖時(shí)都遵循了從數(shù)據(jù)集中學(xué)到的構(gòu)圖和光影,但當(dāng)這些來自不同樣本的素材雜糅到一起后,它們給人的感覺就成了既熟悉又奇怪。

當(dāng)它試圖“復(fù)制”各種人造設(shè)備(洗衣機(jī)?熔爐?)時(shí),圖像呈現(xiàn)的畫面又極具藝術(shù)氣息,仿佛電影中的一些夸張而富有韻味的過場鏡頭。

更有甚者,BigGAN還能模仿宏觀上的軟焦點(diǎn),即一種通過有意識降低鏡頭的清晰度,得到柔和的表現(xiàn)效果的攝影技巧。如下圖所示,我們看不清圖中的對象是什么,但它們都表現(xiàn)出了極強(qiáng)的繪畫感。

即便是最普通的東西,BigGAN仿佛成了一面濾鏡,把它們渲染得極具美感,令人難以忘懷。

這是藝術(shù)嗎?對于計(jì)算機(jī)視覺任務(wù)而言,這些充滿“想象力”的扭曲恰好是BigGAN的不足,畢竟它的目標(biāo)是生成極其逼真,同時(shí)盡可能多樣化的圖像。它并不是在創(chuàng)作,而只是在模型它看到的數(shù)據(jù)——ImageNet,一個巨大的用于訓(xùn)練各種圖像處理算法的通用數(shù)據(jù)集。

但是,我們也必需認(rèn)識到,研究人員在BigGAN的輸出里精挑細(xì)選的過程其實(shí)也是一種藝術(shù)行為,包括這篇文章本身。你可以用這種方法講述一個故事,或是制作一部令人難忘的美麗電影,這一切都取決于你收集的數(shù)據(jù)集以及選擇的輸出。未來,像BigGAN這樣的算法將改變?nèi)祟愃囆g(shù)——不是取代人類藝術(shù)家,而是成為一個強(qiáng)大的新協(xié)作工具。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:拆臺BigGan:“失敗”圖像生成集錦

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    低質(zhì)量圖像生成與增強(qiáng)的區(qū)別 圖像生成領(lǐng)域中存在的難點(diǎn)

    1. 論文信息 ? 2. 引言 ? 這篇論文的研究背景是圖像生成領(lǐng)域中存在的難點(diǎn) - 如何從低質(zhì)量的
    的頭像 發(fā)表于 08-03 15:36 ?2123次閱讀
    低質(zhì)量<b class='flag-5'>圖像</b>的<b class='flag-5'>生成</b>與增強(qiáng)的區(qū)別 <b class='flag-5'>圖像</b><b class='flag-5'>生成</b><b class='flag-5'>領(lǐng)域</b>中存在的難點(diǎn)

    在AD中,我的原理圖里面有三反向器,我想用74LS04封裝來表示,但是生成pcb時(shí)總是74ls04,如果真的制作電路板,豈不是很浪費(fèi)材料,我想問會用AD的大神們,如何把原理圖中的三反相器用74ls04封裝在pcb里面表示。謝謝了。

    在AD中,我的原理圖里面有三反向器,我想用74LS04封裝來表示,但是生成pcb時(shí)總是
    發(fā)表于 05-22 21:40

    智能音響,智能WIFI,智能窗簾等智能的東西越來越多,然而我發(fā)現(xiàn)現(xiàn)在智能鎖也出來了,智能鎖真的那么好嗎?

    鎖也出來了,真的是世界那么大,無奇不???智能鎖算是新的說明詞把,智能鎖真的
    發(fā)表于 05-21 10:41

    低電流損耗真的好嗎?

    用電流損耗更低的RS-485收發(fā)器替代舊器件,結(jié)果卻發(fā)生故障,是什么原因呢?低電流損耗真的好嗎?
    發(fā)表于 08-07 08:29

    異步信號的處理真的那么神秘嗎

    說到異步時(shí)鐘域的信號處理,想必是FPGA設(shè)計(jì)中很關(guān)鍵的技術(shù),也是令很多工程師對FPGA望 而卻步的原因。但是異步信號的處理真的那么神秘
    發(fā)表于 11-04 08:03

    美圖手機(jī),iphoneSE真的想象中的那么好嗎

    些手機(jī)由于市場的炒作,導(dǎo)致被高估了。部分入手的用戶,表示這些手機(jī)拿到手并沒有想象中的那么好。
    發(fā)表于 03-09 09:54 ?4720次閱讀

    華為P10的徠卡雙攝水平如何?看完樣張你來告訴我

    華為P10   如果你徠卡信仰,那么你聽到徠卡第二代雙攝定會心動不已。   但是效果真的
    發(fā)表于 03-09 15:23 ?4139次閱讀

    手機(jī)攝像頭進(jìn)步空間巨大,論手機(jī)攝像頭原理及應(yīng)用

    據(jù)外媒報(bào)道,LG下款手機(jī)V40將配備5攝像頭,前置2后置3。不只是LG,早在今年4月,華為就發(fā)布了P20系列,從主流雙攝提升到了三攝。手機(jī)的攝像頭是越來越多了,拍攝
    發(fā)表于 07-22 08:05 ?3089次閱讀

    圖像生成領(lǐng)域巨大進(jìn)展:SAGAN

    近年來,生成圖像建模領(lǐng)域出現(xiàn)了不少成果,其中最前沿的是GAN,它能直接從數(shù)據(jù)中學(xué)習(xí),生成高保真、多樣化的圖像。雖然GAN的訓(xùn)練是動態(tài)的,而且
    的頭像 發(fā)表于 10-08 09:11 ?1.4w次閱讀

    名為Metaverse的工具來幫助人們快速生成真的訓(xùn)練數(shù)據(jù)

    有的算法需要使用者具有定的編程能力,而有的算法生成的結(jié)果卻又不是那么逼真。我們真正需要的是能夠方便高效地
    的頭像 發(fā)表于 10-08 15:20 ?6190次閱讀

    還記得前些日子轟動時(shí)的BigGAN模型嗎?

    為方便開發(fā)者練習(xí)和使用,DeepMind 今天又公開了 BigGAN 的 TensorFlow Hub,順帶還提供了在 Colab 上的 demo,開發(fā)者可以在 Colab 上運(yùn)行圖像生成和插值任務(wù)。
    的頭像 發(fā)表于 11-14 09:31 ?7802次閱讀

    當(dāng)前生成圖像最逼真的BigGAN被谷歌超越!造假效果更為逼真

    當(dāng)前生成圖像最逼真的BigGAN被超越了!
    的頭像 發(fā)表于 03-11 15:28 ?4430次閱讀

    基于生成式對抗網(wǎng)絡(luò)的圖像補(bǔ)全方法

    圖像補(bǔ)全是數(shù)字圖像處理領(lǐng)域的重要研究方向,具有廣闊的應(yīng)用前景。提出了種基于生成式對抗網(wǎng)絡(luò)(GAN)的
    發(fā)表于 05-19 14:38 ?14次下載

    智能鎖真的那么好嗎,智能鎖的優(yōu)勢是什么

    為什么要換智能鎖、智能鎖真的那么好嗎?相信部分的人會有這樣子的疑問,但是我想說的是,就算你
    的頭像 發(fā)表于 06-29 17:43 ?2859次閱讀

    差分對緊耦合真的比松耦合好嗎

    差分對緊耦合真的比松耦合好嗎?
    的頭像 發(fā)表于 11-30 15:24 ?1299次閱讀
    差分對緊耦合<b class='flag-5'>真的</b>比松耦合<b class='flag-5'>好嗎</b>?