亚州中文无码AV在线观看,美腿丝袜综合亚洲

標(biāo)識(shí)設(shè)計(jì)是一個(gè)費(fèi)時(shí)費(fèi)力的過(guò)程。而最近生成式模型領(lǐng)域進(jìn)展飛速，這就讓人好奇AI可不可以用來(lái)設(shè)計(jì)標(biāo)識(shí)？生成對(duì)抗網(wǎng)絡(luò)（GAN）據(jù)說(shuō)能夠?qū)W習(xí)模擬任何數(shù)據(jù)分布，已經(jīng)取得了廣泛的應(yīng)用，但目前很少有人研究如何用GAN來(lái)設(shè)計(jì)標(biāo)識(shí)。年底召開(kāi)的ICMLA 2018上有一篇論文，馬斯特里赫特大學(xué)的Ajkel Mino和Gerasimos Spanakis，提出了根據(jù)顏色自動(dòng)生成標(biāo)識(shí)的LoGAN模型，可以說(shuō)是這一方向上的初步探索。

LoGAN架構(gòu)

GAN

在介紹LoGAN架構(gòu)之前，先溫習(xí)下GAN網(wǎng)絡(luò)。

GAN由生成器和判別器兩個(gè)神經(jīng)網(wǎng)絡(luò)組成，以對(duì)抗的形式同時(shí)訓(xùn)練。

GAN是出名的難訓(xùn)練，飽受訓(xùn)練不穩(wěn)定、無(wú)法收斂、模式崩塌之苦。近年來(lái)有不少研究都試圖改進(jìn)GAN的訓(xùn)練過(guò)程，例如在GAN中引入深度卷積層（DCGAN），修改目標(biāo)函數(shù)（LSGAN和WGAN）。

條件GAN

如前所述，LoGAN是根據(jù)顏色自動(dòng)生成標(biāo)識(shí)，換句話(huà)說(shuō)，是以顏色為條件。能夠基于標(biāo)簽數(shù)據(jù)生成特定分類(lèi)的圖像的GAN架構(gòu)，主要有兩種：

CGAN，生成器和判別器都額外接受一個(gè)類(lèi)別標(biāo)簽數(shù)據(jù)。

AC-GAN，判別器不僅需要識(shí)別圖像的真?zhèn)?，還需要判斷圖像的類(lèi)別（不論真?zhèn)危?/p>

GAN、CGAN、AC-GAN架構(gòu)對(duì)比

LoGAN即基于AC-GAN改造得到。

AC-WGAN-GP

在AC-GAN架構(gòu)中（參見(jiàn)上圖），判別器同時(shí)優(yōu)化真?zhèn)握`差和類(lèi)別誤差：

不過(guò)，考慮到WGAN-GP更穩(wěn)定，所以L(fǎng)oGAN用WGAN-GP的損失函數(shù)替換了AC-GAN的損失函數(shù)：

但是這就造成了一個(gè)問(wèn)題，類(lèi)別損失沒(méi)有了。所以，LoGAN在AC-GAN的基礎(chǔ)上額外增加了一個(gè)分類(lèi)器Q，輔助判別器進(jìn)行分類(lèi)。也就是說(shuō)，和AC-GAN不同，LoGAN由三個(gè)網(wǎng)絡(luò)組成：生成器G、判別器D、分類(lèi)器Q。

經(jīng)過(guò)改造的AC-GAN

分類(lèi)器Q的損失函數(shù)定義如下：

為了避免訓(xùn)練不穩(wěn)和模式崩塌，LoGAN的訓(xùn)練借鑒了一些最新研究成果，采取了以下措施：

判別器每迭代5次，分別迭代一次生成器和分類(lèi)器。

z取樣自高斯分布。

應(yīng)用了批歸一化。

試驗(yàn)

數(shù)據(jù)集

LoGAN基于LLD-icons數(shù)據(jù)集訓(xùn)練，該數(shù)據(jù)集包含486377張32×32像素的圖標(biāo)。

使用了K均值聚類(lèi)（k = 3）從圖像中提取主要色彩，然后分為黑、藍(lán)、棕等12類(lèi)：

訓(xùn)練

下為判別器、生成器、分類(lèi)器的訓(xùn)練損失圖像。

從圖中我們可以看到，判別器和生成器的損失圖像有下降趨勢(shì)，沒(méi)有收斂。不過(guò)這并不意味著訓(xùn)練有問(wèn)題，因?yàn)閃GAN和WGAN-GP都不保證收斂。另一方面，分類(lèi)器收斂至接近1的損失值。實(shí)際上，生成圖像的分類(lèi)損失收斂至零，這意味著生成圖像都能被正確分類(lèi)。

結(jié)果

400個(gè)epoch的訓(xùn)練后，每個(gè)分類(lèi)生成了64個(gè)標(biāo)識(shí)：

由于是在32×32像素的圖標(biāo)上訓(xùn)練的，所以生成的標(biāo)識(shí)有點(diǎn)模糊。生成的標(biāo)識(shí)大多為圓形或方形，但也有不規(guī)則形狀，如心形和X形。

各個(gè)分類(lèi)主要顏色的準(zhǔn)確率、召回、F1數(shù)據(jù)如下表所示：

有些分類(lèi)的評(píng)分偏低，這是因?yàn)楹芏鄨D標(biāo)周?chē)褂冒咨鳛楸尘?，同理，灰色作為中性色，也有很多圖標(biāo)使用。

各分類(lèi)主要顏色分布

改進(jìn)方向

盡管取得了很有潛力的結(jié)果，LoGAN目前還是有不少限制：

對(duì)抗生成網(wǎng)絡(luò)的常見(jiàn)問(wèn)題，生成的標(biāo)識(shí)很模糊。使用分辨率更高的訓(xùn)練圖像應(yīng)該能緩解這一問(wèn)題。

僅僅使用顏色作為關(guān)鍵詞局限性太大。未來(lái)考慮加入形狀、公司的重心等其他關(guān)鍵詞。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴