一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

根據(jù)顏色自動(dòng)生成標(biāo)識(shí)的LoGAN模型

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-11-05 15:10 ? 次閱讀

標(biāo)識(shí)設(shè)計(jì)是一個(gè)費(fèi)時(shí)費(fèi)力的過程。而最近生成式模型領(lǐng)域進(jìn)展飛速,這就讓人好奇AI可不可以用來設(shè)計(jì)標(biāo)識(shí)?生成對(duì)抗網(wǎng)絡(luò)(GAN)據(jù)說能夠?qū)W習(xí)模擬任何數(shù)據(jù)分布,已經(jīng)取得了廣泛的應(yīng)用,但目前很少有人研究如何用GAN來設(shè)計(jì)標(biāo)識(shí)。年底召開的ICMLA 2018上有一篇論文,馬斯特里赫特大學(xué)的Ajkel Mino和Gerasimos Spanakis,提出了根據(jù)顏色自動(dòng)生成標(biāo)識(shí)的LoGAN模型,可以說是這一方向上的初步探索。

LoGAN架構(gòu)

GAN

在介紹LoGAN架構(gòu)之前,先溫習(xí)下GAN網(wǎng)絡(luò)。

GAN由生成器和判別器兩個(gè)神經(jīng)網(wǎng)絡(luò)組成,以對(duì)抗的形式同時(shí)訓(xùn)練。

GAN是出名的難訓(xùn)練,飽受訓(xùn)練不穩(wěn)定、無法收斂、模式崩塌之苦。近年來有不少研究都試圖改進(jìn)GAN的訓(xùn)練過程,例如在GAN中引入深度卷積層(DCGAN),修改目標(biāo)函數(shù)(LSGAN和WGAN)。

條件GAN

如前所述,LoGAN是根據(jù)顏色自動(dòng)生成標(biāo)識(shí),換句話說,是以顏色為條件。能夠基于標(biāo)簽數(shù)據(jù)生成特定分類的圖像的GAN架構(gòu),主要有兩種:

CGAN,生成器和判別器都額外接受一個(gè)類別標(biāo)簽數(shù)據(jù)。

AC-GAN,判別器不僅需要識(shí)別圖像的真?zhèn)?,還需要判斷圖像的類別(不論真?zhèn)危?/p>

GAN、CGAN、AC-GAN架構(gòu)對(duì)比

LoGAN即基于AC-GAN改造得到。

AC-WGAN-GP

在AC-GAN架構(gòu)中(參見上圖),判別器同時(shí)優(yōu)化真?zhèn)握`差和類別誤差:

不過,考慮到WGAN-GP更穩(wěn)定,所以LoGAN用WGAN-GP的損失函數(shù)替換了AC-GAN的損失函數(shù):

但是這就造成了一個(gè)問題,類別損失沒有了。所以,LoGAN在AC-GAN的基礎(chǔ)上額外增加了一個(gè)分類器Q,輔助判別器進(jìn)行分類。也就是說,和AC-GAN不同,LoGAN由三個(gè)網(wǎng)絡(luò)組成:生成器G、判別器D、分類器Q。

經(jīng)過改造的AC-GAN

分類器Q的損失函數(shù)定義如下:

為了避免訓(xùn)練不穩(wěn)和模式崩塌,LoGAN的訓(xùn)練借鑒了一些最新研究成果,采取了以下措施:

判別器每迭代5次,分別迭代一次生成器和分類器。

z取樣自高斯分布。

應(yīng)用了批歸一化。

試驗(yàn)

數(shù)據(jù)集

LoGAN基于LLD-icons數(shù)據(jù)集訓(xùn)練,該數(shù)據(jù)集包含486377張32×32像素的圖標(biāo)。

使用了K均值聚類(k = 3)從圖像中提取主要色彩,然后分為黑、藍(lán)、棕等12類:

訓(xùn)練

下為判別器、生成器、分類器的訓(xùn)練損失圖像。

從圖中我們可以看到,判別器和生成器的損失圖像有下降趨勢,沒有收斂。不過這并不意味著訓(xùn)練有問題,因?yàn)閃GAN和WGAN-GP都不保證收斂。另一方面,分類器收斂至接近1的損失值。實(shí)際上,生成圖像的分類損失收斂至零,這意味著生成圖像都能被正確分類。

結(jié)果

400個(gè)epoch的訓(xùn)練后,每個(gè)分類生成了64個(gè)標(biāo)識(shí):

由于是在32×32像素的圖標(biāo)上訓(xùn)練的,所以生成的標(biāo)識(shí)有點(diǎn)模糊。生成的標(biāo)識(shí)大多為圓形或方形,但也有不規(guī)則形狀,如心形和X形。

各個(gè)分類主要顏色的準(zhǔn)確率、召回、F1數(shù)據(jù)如下表所示:

有些分類的評(píng)分偏低,這是因?yàn)楹芏鄨D標(biāo)周圍使用白色作為背景,同理,灰色作為中性色,也有很多圖標(biāo)使用。

各分類主要顏色分布

改進(jìn)方向

盡管取得了很有潛力的結(jié)果,LoGAN目前還是有不少限制:

對(duì)抗生成網(wǎng)絡(luò)的常見問題,生成的標(biāo)識(shí)很模糊。使用分辨率更高的訓(xùn)練圖像應(yīng)該能緩解這一問題。

僅僅使用顏色作為關(guān)鍵詞局限性太大。未來考慮加入形狀、公司的重心等其他關(guān)鍵詞。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    2137

    瀏覽量

    75795
  • 生成器
    +關(guān)注

    關(guān)注

    7

    文章

    322

    瀏覽量

    21559

原文標(biāo)題:LoGAN:根據(jù)顏色自動(dòng)生成標(biāo)識(shí)

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    labview樹形控件標(biāo)識(shí)自動(dòng)更改相關(guān)問題討論

    各位大神,我現(xiàn)在編程序想能動(dòng)態(tài)的更改項(xiàng)標(biāo)識(shí)符,然后進(jìn)行內(nèi)容保存等功能。我現(xiàn)在編好的程序能實(shí)現(xiàn)通過右鍵快捷鍵實(shí)現(xiàn)添加、刪除項(xiàng)的功能,并能根據(jù)項(xiàng)是否打開來自動(dòng)更改項(xiàng)符號(hào)。保存內(nèi)容部分尚未完全實(shí)現(xiàn),只能
    發(fā)表于 09-10 11:04

    基于模型設(shè)計(jì)和自動(dòng)代碼生成的一些書籍

    基于模型設(shè)計(jì)和自動(dòng)代碼生成的一些書籍鏈接:鏈接:http://pan.baidu.com/s/1c29mQp6 密碼:g1iy
    發(fā)表于 12-15 12:19

    multisim可以根據(jù)邏輯函數(shù)自動(dòng)生成邏輯圖嗎?

    multisim可以根據(jù)邏輯函數(shù)自動(dòng)生成邏輯圖嗎?
    發(fā)表于 05-01 22:29

    基于模型設(shè)計(jì)的HDL代碼自動(dòng)生成技術(shù)綜述

    摘要:在調(diào)研近幾年基于模型設(shè)計(jì)的HDL代碼自動(dòng)生成技術(shù)相關(guān)工具及工程應(yīng)用情況的基礎(chǔ)上,從HDL代碼自動(dòng)生成的技術(shù)角度分析了基于
    發(fā)表于 06-08 09:29

    為什么生成模型值得研究

    1.Why study generative modeling? 人們可能很自然地想知道為什么生成模型值得研究,尤其是那些只能夠生成數(shù)據(jù)而不能提供密度函數(shù)估計(jì)的生成
    發(fā)表于 09-15 06:03

    Simulink 自動(dòng)代碼生成原理分享

    多出來一些目標(biāo)系統(tǒng)可以選擇。自定義目標(biāo)系統(tǒng)是為了讓Simulink生成的代碼能根據(jù)用戶的需要,與底層驅(qū)動(dòng)做集成。我們首先需要了解Simulink目標(biāo)編譯的流程,如下圖,Simulink模型會(huì)先變成一個(gè)
    發(fā)表于 05-31 11:19

    CRC校驗(yàn)代碼自動(dòng)生成工具

    CRC校驗(yàn)代碼自動(dòng)生成工具根據(jù)輸入條件自動(dòng)產(chǎn)生各種CRC的VHDL或verilog源程序
    發(fā)表于 05-20 11:16 ?294次下載
    CRC校驗(yàn)代碼<b class='flag-5'>自動(dòng)</b><b class='flag-5'>生成</b>工具

    自動(dòng)標(biāo)識(shí)燈電路

    自動(dòng)標(biāo)識(shí)燈電路
    發(fā)表于 08-27 15:07 ?777次閱讀
    <b class='flag-5'>自動(dòng)</b><b class='flag-5'>標(biāo)識(shí)</b>燈電路

    基于顏色和區(qū)域的運(yùn)動(dòng)目標(biāo)識(shí)

    針對(duì)全自主足球機(jī)器人目標(biāo)識(shí)別受光強(qiáng)變化的影響, 實(shí)時(shí)性、準(zhǔn)確性和魯棒性存在的不足, 提出了一種基于動(dòng)態(tài)窗口HSI 色彩空間模型的閾值向量位與及區(qū)域合并算法, 并通過動(dòng)態(tài)窗口減小
    發(fā)表于 06-28 15:36 ?34次下載
    基于<b class='flag-5'>顏色</b>和區(qū)域的運(yùn)動(dòng)目<b class='flag-5'>標(biāo)識(shí)</b>別

    OpenAI最新提出的可逆生成模型Glow

    low是一種可逆生成模型(reversible generative model),也被稱為基于流的生成模型(flow-based generative model)。目前,學(xué)界還很少
    的頭像 發(fā)表于 07-11 09:46 ?7482次閱讀

    機(jī)器視覺中圖像前置知識(shí)顏色模型的分類與應(yīng)用

    RGB顏色模型(也叫紅、綠、藍(lán)三原色模型或者加色混色模型):將紅、綠、藍(lán)3種不同顏色,根據(jù)亮度配
    的頭像 發(fā)表于 06-11 09:02 ?5407次閱讀
    機(jī)器視覺中圖像前置知識(shí)<b class='flag-5'>顏色</b><b class='flag-5'>模型</b>的分類與應(yīng)用

    安全關(guān)鍵系統(tǒng)的擴(kuò)展SysML模型自動(dòng)生成

    安全關(guān)鍵系統(tǒng)的擴(kuò)展SysML模型自動(dòng)生成
    發(fā)表于 06-09 14:38 ?3次下載

    c語言代碼自動(dòng)生成工具,MCU代碼自動(dòng)生成工具介紹

    自動(dòng)生成服務(wù)。云端會(huì)根據(jù)產(chǎn)品定義的數(shù)據(jù)點(diǎn)生成對(duì)應(yīng)產(chǎn)品的設(shè)備端代碼。自動(dòng)生成的代碼實(shí)現(xiàn)了機(jī)智云通信
    發(fā)表于 10-28 17:36 ?8次下載
    c語言代碼<b class='flag-5'>自動(dòng)</b><b class='flag-5'>生成</b>工具,MCU代碼<b class='flag-5'>自動(dòng)</b><b class='flag-5'>生成</b>工具介紹

    EB-LOGAN-23 REV-A 評(píng)估板 User 手冊(cè)(Fab: 18-691-000)

    EB-LOGAN-23 REV-A 評(píng)估板 User 手冊(cè) (Fab: 18-691-000)
    發(fā)表于 04-17 19:41 ?0次下載
    EB-<b class='flag-5'>LOGAN</b>-23 REV-A 評(píng)估板 User 手冊(cè)(Fab: 18-691-000)

    谷歌發(fā)布全新視頻生成模型Veo與Imagen文生圖模型

    谷歌近日宣布了兩項(xiàng)重大技術(shù)進(jìn)展,首先是視頻生成模型Veo的正式推出。這款先進(jìn)的模型能夠支持生成質(zhì)量更高的視頻內(nèi)容,讓用戶能夠根據(jù)自己的需求設(shè)
    的頭像 發(fā)表于 05-16 10:46 ?533次閱讀