作為我的論文《基于分辨率的GAN插值用于域間的可控圖像合成》的一部分,我使用浮世繪人臉圖像的數(shù)據(jù)集來(lái)訓(xùn)練StyleGAN模型,本文包含該數(shù)據(jù)集的鏈接和該數(shù)據(jù)集的詳細(xì)信息。
更新
V2 - 刪除了28張質(zhì)量不好的圖像(對(duì)準(zhǔn)不良或沒(méi)有正面)。
V1 - 最初發(fā)行的版本,被使用在與分辨率相關(guān)的GAN插值的論文中,用于域之間的可控圖像合成。
數(shù)據(jù)集 浮世繪人臉數(shù)據(jù)集包含來(lái)自浮世繪照片的5209張臉部圖像。圖像像素為1024x1024、jpeg格式,并已根據(jù)FFHQ數(shù)據(jù)集所使用的過(guò)程進(jìn)行對(duì)齊。上面是數(shù)據(jù)集中(幾乎)所有圖像的地圖,對(duì)圖像進(jìn)行了繪制,以使相似的面孔看起來(lái)靠近在一起[2]。為了便于顯示, 圖像已縮小為256x256。 細(xì)節(jié) 圖片是從數(shù)個(gè)博物館網(wǎng)站上下載來(lái)的,然后我使用Amazon Rekognition嘗試從每個(gè)圖片中檢測(cè)面部和面部標(biāo)志。Rekognition在這兩個(gè)任務(wù)上都做得很合理,但是顯然并不完美,很多面部都被遺漏了,并且許多圖像中都存在對(duì)齊錯(cuò)誤。同時(shí),許多圖像的分辨率並不是很高,因此為了生成1024x1024分辨率的可用數(shù)據(jù)集,我使用了在Manga109數(shù)據(jù)集上訓(xùn)練的預(yù)訓(xùn)練的ESRGAN [3]模型來(lái)按需放大圖像,盡管這些圖像會(huì)留下一些瑕疵,但大體上的結(jié)果還是不錯(cuò)的。 其他數(shù)據(jù)集
KaoKore是浮世繪人臉的另一個(gè)數(shù)據(jù)集[4],它具有更多的多樣性和標(biāo)簽,但是圖像分辨率較低且人臉未對(duì)齊。 許可和使用 此數(shù)據(jù)集是根據(jù)``知識(shí)共享署名-相同方式共享4.0國(guó)際許可證''提供的。 如果使用數(shù)據(jù)集,請(qǐng)引用為“Aligned ukiyo-e faces dataset, Justin Pinkney 2020”或一個(gè)bibtex條目:
1. Pinkney, Justin N. M., and Doron Adler. ‘Resolution Dependent GAN Interpolation for Controllable Image Synthesis Between Domains’. ArXiv:2010.05334[Cs, Eess], 20 October 2020.http://arxiv.org/abs/2010.05334. 2. 為了生成此圖像,我首先使用在Imagenet上預(yù)訓(xùn)練的ResNet50從每個(gè)圖像中提取CNN的特征。然后使用UMAP將這些高維特征向量投影到二維,最后使用lapjv算法完成網(wǎng)格劃分。 3. Wang, Xintao, Ke Yu, Shixiang Wu, Jinjin Gu, Yihao Liu, Chao Dong, Chen Change Loy, Yu Qiao, and Xiaoou Tang. ‘ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks’. ArXiv:1809.00219[Cs], 1 September 2018.http://arxiv.org/abs/1809.00219. 4. Tian, Yingtao, Chikahiko Suzuki, Tarin Clanuwat, Mikel Bober-Irizar, Alex Lamb, and Asanobu Kitamoto. ‘KaoKore: A Pre-Modern Japanese Art Facial Expression Dataset’. ArXiv:2002.08595[Cs, Stat], 20 February 2020.http://arxiv.org/abs/2002.08595.
責(zé)任編輯:lq
-
圖像
+關(guān)注
關(guān)注
2文章
1094瀏覽量
41237 -
分辨率
+關(guān)注
關(guān)注
2文章
1080瀏覽量
42642 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1224瀏覽量
25439
原文標(biāo)題:Ukiyo-e faces dataset 浮世繪面孔數(shù)據(jù)集
文章出處:【微信號(hào):livevideostack,微信公眾號(hào):LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
瑞芯微模型量化文件構(gòu)建
請(qǐng)問(wèn)如何在imx8mplus上部署和運(yùn)行YOLOv5訓(xùn)練的模型?
用PaddleNLP為GPT-2模型制作FineWeb二進(jìn)制預(yù)訓(xùn)練數(shù)據(jù)集

評(píng)論