標(biāo)識(shí)設(shè)計(jì)是一個(gè)費(fèi)時(shí)費(fèi)力的過程。而最近生成式模型領(lǐng)域進(jìn)展飛速,這就讓人好奇AI可不可以用來設(shè)計(jì)標(biāo)識(shí)?生成對(duì)抗網(wǎng)絡(luò)(GAN)據(jù)說能夠?qū)W習(xí)模擬任何數(shù)據(jù)分布,已經(jīng)取得了廣泛的應(yīng)用,但目前很少有人研究如何用GAN來設(shè)計(jì)標(biāo)識(shí)。年底召開的ICMLA 2018上有一篇論文,馬斯特里赫特大學(xué)的Ajkel Mino和Gerasimos Spanakis,提出了根據(jù)顏色自動(dòng)生成標(biāo)識(shí)的LoGAN模型,可以說是這一方向上的初步探索。
LoGAN架構(gòu)
GAN
在介紹LoGAN架構(gòu)之前,先溫習(xí)下GAN網(wǎng)絡(luò)。
GAN由生成器和判別器兩個(gè)神經(jīng)網(wǎng)絡(luò)組成,以對(duì)抗的形式同時(shí)訓(xùn)練。
GAN是出名的難訓(xùn)練,飽受訓(xùn)練不穩(wěn)定、無法收斂、模式崩塌之苦。近年來有不少研究都試圖改進(jìn)GAN的訓(xùn)練過程,例如在GAN中引入深度卷積層(DCGAN),修改目標(biāo)函數(shù)(LSGAN和WGAN)。
條件GAN
如前所述,LoGAN是根據(jù)顏色自動(dòng)生成標(biāo)識(shí),換句話說,是以顏色為條件。能夠基于標(biāo)簽數(shù)據(jù)生成特定分類的圖像的GAN架構(gòu),主要有兩種:
CGAN,生成器和判別器都額外接受一個(gè)類別標(biāo)簽數(shù)據(jù)。
AC-GAN,判別器不僅需要識(shí)別圖像的真?zhèn)?,還需要判斷圖像的類別(不論真?zhèn)危?/p>
GAN、CGAN、AC-GAN架構(gòu)對(duì)比
LoGAN即基于AC-GAN改造得到。
AC-WGAN-GP
在AC-GAN架構(gòu)中(參見上圖),判別器同時(shí)優(yōu)化真?zhèn)握`差和類別誤差:
不過,考慮到WGAN-GP更穩(wěn)定,所以LoGAN用WGAN-GP的損失函數(shù)替換了AC-GAN的損失函數(shù):
但是這就造成了一個(gè)問題,類別損失沒有了。所以,LoGAN在AC-GAN的基礎(chǔ)上額外增加了一個(gè)分類器Q,輔助判別器進(jìn)行分類。也就是說,和AC-GAN不同,LoGAN由三個(gè)網(wǎng)絡(luò)組成:生成器G、判別器D、分類器Q。
經(jīng)過改造的AC-GAN
分類器Q的損失函數(shù)定義如下:
為了避免訓(xùn)練不穩(wěn)和模式崩塌,LoGAN的訓(xùn)練借鑒了一些最新研究成果,采取了以下措施:
判別器每迭代5次,分別迭代一次生成器和分類器。
z取樣自高斯分布。
應(yīng)用了批歸一化。
試驗(yàn)
數(shù)據(jù)集
LoGAN基于LLD-icons數(shù)據(jù)集訓(xùn)練,該數(shù)據(jù)集包含486377張32×32像素的圖標(biāo)。
使用了K均值聚類(k = 3)從圖像中提取主要色彩,然后分為黑、藍(lán)、棕等12類:
訓(xùn)練
下為判別器、生成器、分類器的訓(xùn)練損失圖像。
從圖中我們可以看到,判別器和生成器的損失圖像有下降趨勢,沒有收斂。不過這并不意味著訓(xùn)練有問題,因?yàn)閃GAN和WGAN-GP都不保證收斂。另一方面,分類器收斂至接近1的損失值。實(shí)際上,生成圖像的分類損失收斂至零,這意味著生成圖像都能被正確分類。
結(jié)果
400個(gè)epoch的訓(xùn)練后,每個(gè)分類生成了64個(gè)標(biāo)識(shí):
由于是在32×32像素的圖標(biāo)上訓(xùn)練的,所以生成的標(biāo)識(shí)有點(diǎn)模糊。生成的標(biāo)識(shí)大多為圓形或方形,但也有不規(guī)則形狀,如心形和X形。
各個(gè)分類主要顏色的準(zhǔn)確率、召回、F1數(shù)據(jù)如下表所示:
有些分類的評(píng)分偏低,這是因?yàn)楹芏鄨D標(biāo)周圍使用白色作為背景,同理,灰色作為中性色,也有很多圖標(biāo)使用。
各分類主要顏色分布
改進(jìn)方向
盡管取得了很有潛力的結(jié)果,LoGAN目前還是有不少限制:
對(duì)抗生成網(wǎng)絡(luò)的常見問題,生成的標(biāo)識(shí)很模糊。使用分辨率更高的訓(xùn)練圖像應(yīng)該能緩解這一問題。
僅僅使用顏色作為關(guān)鍵詞局限性太大。未來考慮加入形狀、公司的重心等其他關(guān)鍵詞。
-
GaN
+關(guān)注
關(guān)注
19文章
2137瀏覽量
75795 -
生成器
+關(guān)注
關(guān)注
7文章
322瀏覽量
21559
原文標(biāo)題:LoGAN:根據(jù)顏色自動(dòng)生成標(biāo)識(shí)
文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
labview樹形控件標(biāo)識(shí)符自動(dòng)更改相關(guān)問題討論
基于模型設(shè)計(jì)和自動(dòng)代碼生成的一些書籍
multisim可以根據(jù)邏輯函數(shù)自動(dòng)生成邏輯圖嗎?
基于模型設(shè)計(jì)的HDL代碼自動(dòng)生成技術(shù)綜述
為什么生成模型值得研究
Simulink 自動(dòng)代碼生成原理分享
CRC校驗(yàn)代碼自動(dòng)生成工具

基于顏色和區(qū)域的運(yùn)動(dòng)目標(biāo)識(shí)別

OpenAI最新提出的可逆生成模型Glow
安全關(guān)鍵系統(tǒng)的擴(kuò)展SysML模型自動(dòng)生成
c語言代碼自動(dòng)生成工具,MCU代碼自動(dòng)生成工具介紹

EB-LOGAN-23 REV-A 評(píng)估板 User 手冊(cè)(Fab: 18-691-000)

評(píng)論