一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GTN可以勾勒出夸張的幾何線條?

lhl545545 ? 來源:中科院長春光機所 ? 作者:中科院長春光機所 ? 2020-06-05 15:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

漫畫是很多人的童年回憶,除了經(jīng)典的《銀魂》、《海賊王》、《火影》,久保帶人的作品《死神》也很有人氣。最近,六位來自北航的研究者推出了一款漫畫臉轉(zhuǎn)換模型「MangaGAN」,實現(xiàn)了真人照片到漫畫臉的完美轉(zhuǎn)換。

我們可以合理懷疑,幾位論文作者都是久保帶人的粉絲。

這篇論文中提出的「MangaGAN」,是一種基于生成對抗網(wǎng)絡(luò)(GAN)的非成對照片到漫畫轉(zhuǎn)換方法。用來訓(xùn)練 MangaGAN 的數(shù)據(jù)集也來源于一部非常受歡迎的漫畫作品——久保帶人的《死神(Bleach)》,包含漫畫人臉的面部特征、特征點、身體等元素,所以生成結(jié)果也帶有強烈的久保帶人風(fēng)格。

標(biāo)準(zhǔn)漫畫臉是如何生成的?

MangaGAN 生成漫畫臉的整體流程。

總體來說,MangaGAN 包含兩個分支:

一個分支通過幾何轉(zhuǎn)換網(wǎng)絡(luò)(Geometric Transformation Network,GTN)學(xué)習(xí)幾何映射;

另一個分支通過外觀轉(zhuǎn)換網(wǎng)絡(luò)(Appearance Transformation Network,ATN)學(xué)習(xí)外觀映射。

最后通過合成模塊將二者融合,從而生成漫畫臉。

假設(shè) P 表示照片,M 表示生成的漫畫臉,二者之間不存在成對關(guān)系。給定一張照片 p∈P,MangaGAN 學(xué)習(xí)映射

 GTN可以勾勒出夸張的幾何線條?

將 p 遷移至樣本

 GTN可以勾勒出夸張的幾何線條?

(m∈M),同時為 m 加上漫畫風(fēng)格和面部相似度。

圖中(f)步驟通過 GTN 勾勒出夸張的幾何線條,并確定五官的幾何分布位置;圖中(e)步驟則通過 ATN 生成所有的面部特征,包括眼睛、鼻子和嘴巴。繼而通過合成模塊將幾何輪廓和面部特征相融合,輸出漫畫臉 m∈M。

外觀轉(zhuǎn)換:ATN

 GTN可以勾勒出夸張的幾何線條?

ATN 是一個 multi-GAN 結(jié)構(gòu)的網(wǎng)絡(luò),包含四個局部 GAN,分別用來轉(zhuǎn)換眼、口、鼻和頭發(fā)這四個面部位置。針對每個部位的 GAN,會有專屬的訓(xùn)練策略和編碼器以改善其性能。

眼睛和嘴巴是漫畫臉的靈魂所在,但也是最難轉(zhuǎn)換的部分,隨著表情的變化,這兩個部位的特征也會變化。

對于眼睛和嘴巴部位,為了實現(xiàn)更好的非成對數(shù)據(jù)匹配,研究者將 CycleGAN 與反向映射(reverse mapping)相結(jié)合,并進行了三項改進:

第一,設(shè)計了一個帶有 SP loss L_SP 的 Similarity Preserving (SP) 模塊,以增強相似度;

第二,訓(xùn)練編碼器 E^eye 用于提取 p^eye 的主干,訓(xùn)練編碼器 E^mouth 用于提取 p^mouth 的輪廓線條;

第三,提出結(jié)構(gòu)平滑損失 L_SS,幫助網(wǎng)絡(luò)生成筆觸平滑的漫畫臉。

使用不同的改進方法得到的眼部和嘴部區(qū)域?qū)Ρ惹闆r。

上圖第 5 列和第 11 列展示了使用 SP 模塊進行改進的效果;第 6 列和第 12 列分別展示了使用編碼器 E^eye 和 E^mouth 的改進效果;第 4 列和第 10 列展示了使用結(jié)構(gòu)平滑損失進行改進的效果。

鼻子和頭發(fā)的生成則相對簡單,大部分動漫人物的鼻型相似,因此該研究使用基于 ProGAN 的架構(gòu)生成鼻子。頭發(fā)部分則使用了 APDdrawingGAN,通過頭發(fā)分割方法劃分出大致的頭發(fā)區(qū)域,然后使用肖像分割方法移除多余的背景區(qū)域,即可生成類似漫畫風(fēng)格的頭發(fā)樣式。

幾何轉(zhuǎn)換:GTN

在轉(zhuǎn)換面部特征點時會遇到一個問題:面部特征的搭配模式限制了結(jié)果的多樣性。比如,臉型相同的人可能有著不同的眼口鼻大小或位置,但 GAN 在接受全局人臉特征點訓(xùn)練時可能遵循固定或類似的搭配模式。因此研究者也將「幾何特征」分解為三種屬性:臉型、位置、大小,并使用三個 sub-GAN 分別轉(zhuǎn)換。

GTN pipeline。幾何信息被分為三種獨立屬性:位置、大小和臉型,然后使用 N_loc、N_siz、N_sha 三個 sub-GAN 分別進行轉(zhuǎn)換。

最終,如圖 5(b) 所示,基于預(yù)定義的臉頰和額頭比例,生成了整張漫畫臉的幾何特征。

最后一步:融合

這一步的目的是融合人臉特征和幾何特征,從而生成漫畫臉。

如上圖所示,首先,根據(jù)幾何特征來調(diào)整和定位各面部特征組件;

其次,基于分段三次 Hermite 插值多項式 (PCHIP) 方法,獲得平滑的曲線并保留臉部形狀,然后通過擬合生成人臉特征點的曲線來繪制臉型;

然后,模型提供了 10 種漫畫式耳朵供選擇,而非按照片重新生成,因為耳朵的樣式對面部表情來說影響不大;

此外,研究者還收集了 8 種漫畫人物身體(manga body),用來與生成的漫畫臉搭配。

最后就可以輸出漫畫結(jié)果啦。該模型提供了快速微調(diào)尺寸和位置的工具,以及鼻子、耳朵和骨架等組件的切換工具,用戶可以按照個人喜好進行調(diào)整,生成自己喜歡的漫畫臉。

MangaGAN 效果如何?

該研究所用的實驗數(shù)據(jù)集包括三部分:漫畫數(shù)據(jù)集、照片數(shù)據(jù)集和人像數(shù)據(jù)集。漫畫數(shù)據(jù)集來源于一部流行的漫畫作品《死神》,包括 448 雙眼睛、109 個鼻子、179 個嘴巴和 106 張正面漫畫臉。

研究者將 MangaGAN 與 9 種漫畫臉生成 SOTA 方法進行了對比,效果生成如下圖所示:

可以看到,其他方法生成的漫畫臉都會有扭曲和突兀的線條,或是面部存在莫名的陰影,其原因在于生成過程中忽視了幾何特征的轉(zhuǎn)換。相比之下,MangaGAN 生成的臉部十分干凈利落,沒有多余的部分。

接下來是跨域轉(zhuǎn)換層面中 MangaGAN 與其他方法的對比。為公平起見,CycleGAN 和 UNIT 先轉(zhuǎn)換全臉再轉(zhuǎn)換每個人臉特征。最終效果如下圖所示:

很明顯,其他方法在匹配照片和漫畫時容易出現(xiàn)問題,它們更關(guān)心二者的黑暗區(qū)域是否匹配,但沒有轉(zhuǎn)換臉型和筆觸。MangaGAN 的生成結(jié)果則更接近理想中的漫畫臉,臉型棱角分明,眉形平滑,嘴巴也進行了簡化,幾乎完全符合手繪漫畫的人物長相特征。
責(zé)任編輯:pj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 幾何
    +關(guān)注

    關(guān)注

    0

    文章

    37

    瀏覽量

    12522
  • 合成
    +關(guān)注

    關(guān)注

    0

    文章

    16

    瀏覽量

    13869
  • ATN
    ATN
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    3724
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    三坐標(biāo)微米級測量精度,高精度檢測液壓支架導(dǎo)向套的幾何公差尺寸

    Mars Classic 10158 三坐標(biāo)測量機可以測量各種復(fù)雜幾何特征,滿足客戶對閥體全尺寸檢測的需求;能實現(xiàn)微米級的高精度測量,滿足導(dǎo)向套關(guān)鍵尺寸的高精度檢測需求;自動測量程序可以快速完成所有測量任務(wù),大大提高檢測效率。
    的頭像 發(fā)表于 07-10 13:33 ?105次閱讀
    三坐標(biāo)微米級測量精度,高精度檢測液壓支架導(dǎo)向套的<b class='flag-5'>幾何</b>公差尺寸

    破解五大運營痛點:盤古信息IMS MOM重塑PCB工廠數(shù)字化基石

    盤古信息以技術(shù)為筆,通過戰(zhàn)略重構(gòu)、流程再造、系統(tǒng)集成、組織賦能的四維協(xié)同,為行業(yè)勾勒從“制造”到“智造”的清晰路徑,推動效率、質(zhì)量、柔性的全面躍升。
    的頭像 發(fā)表于 06-23 10:17 ?171次閱讀
    破解五大運營痛點:盤古信息IMS MOM重塑PCB工廠數(shù)字化基石

    幾何伙伴榮獲ISO 26262:2018汽車功能安全ASIL D流程認(rèn)證

    近日,國際公認(rèn)的測試、檢驗和認(rèn)證機構(gòu)SGS(以下簡稱為“SGS”)為上海幾何伙伴智能駕駛有限公司(以下簡稱“幾何伙伴”)頒發(fā)ISO 26262:2018功能安全ASIL D流程認(rèn)證證書。此項認(rèn)證
    的頭像 發(fā)表于 06-17 14:24 ?411次閱讀

    科而美正式推出新一代RDM線條

    在照明技術(shù)快速迭代的今天,科而美正式推出新一代RDM線條燈,以顛覆性的技術(shù)突破重新定義行業(yè)標(biāo)準(zhǔn)!
    的頭像 發(fā)表于 06-11 15:41 ?392次閱讀

    wafer晶圓幾何形貌測量系統(tǒng):厚度(THK)翹曲度(Warp)彎曲度(Bow)等數(shù)據(jù)測量

    在先進制程中,厚度(THK)翹曲度(Warp)彎曲度(Bow)三者共同決定了晶圓的幾何完整性,是良率提升和成本控制的核心參數(shù)。通過WD4000晶圓幾何形貌測量系統(tǒng)在線檢測,可減少其對芯片性能的影響。
    發(fā)表于 05-28 11:28 ?2次下載

    Simcenter STAR-CCM+幾何體處理,簡化設(shè)計流程,輕松創(chuàng)建、修改和準(zhǔn)備幾何

    優(yōu)勢通過一系列領(lǐng)先CAD和PLM軟件工具導(dǎo)入幾何體,與現(xiàn)有設(shè)計流程輕松集成使用集成的CAD建模器創(chuàng)建、修改和修復(fù)幾何體將各種來源的CAD合并到單一仿真利用自動幾何模型清理、搜索工具、曲面修復(fù)和曲
    的頭像 發(fā)表于 04-01 11:31 ?373次閱讀
    Simcenter STAR-CCM+<b class='flag-5'>幾何</b>體處理,簡化設(shè)計流程,輕松創(chuàng)建、修改和準(zhǔn)備<b class='flag-5'>幾何</b>體

    精密幾何測量技術(shù)在電子芯片制造中的重要性

    精密幾何測量技術(shù)在電子芯片制造中具有極其重要的地位,主要體現(xiàn)在以下幾個方面:1、確保芯片性能-晶體管性能優(yōu)化:在芯片中,晶體管的尺寸和結(jié)構(gòu)對其性能至關(guān)重要。通過精密幾何測量技術(shù),能夠精確測量晶體管
    的頭像 發(fā)表于 02-28 14:23 ?437次閱讀
    精密<b class='flag-5'>幾何</b>測量技術(shù)在電子芯片制造中的重要性

    愛立信與西班牙高校合作推進幾何人工智能研究

    近日,愛立信宣布將成立一個專注于幾何人工智能與機器學(xué)習(xí)等前沿技術(shù)開發(fā)的實驗室。該實驗室的成立,旨在將先進的AI技術(shù)應(yīng)用于包括電信行業(yè)在內(nèi)的廣泛社會領(lǐng)域,推動技術(shù)創(chuàng)新與產(chǎn)業(yè)升級。 幾何人工智能作為AI
    的頭像 發(fā)表于 02-19 14:56 ?539次閱讀

    短波天線的工作原理和類別

    短波通信以其獨特的長距離傳輸能力而聞名,本文將詳細(xì)探討短波天線的工作原理和類別等,勾勒短波天線的大致面貌。
    的頭像 發(fā)表于 02-07 17:33 ?1749次閱讀

    VirtualLab Fusion應(yīng)用:光波導(dǎo)系統(tǒng)中光柵幾何結(jié)構(gòu)的優(yōu)化

    快速物理光學(xué)軟件VirtualLab Fusion具有分析光波導(dǎo)系統(tǒng)性能。這次我們在設(shè)計工作流程中處理一個密切相關(guān)的步驟: 在系統(tǒng)的耦合和擴展區(qū)域中使用的光柵幾何結(jié)構(gòu)的優(yōu)化。 VirtualLab
    發(fā)表于 02-07 09:41

    光波導(dǎo)系統(tǒng)中光柵幾何結(jié)構(gòu)的優(yōu)化

    | | 次我們強調(diào)了快速物理光學(xué)軟件VirtualLab Fusion分析光波導(dǎo)系統(tǒng)性能。這次我們在設(shè)計工作流程中處理一個密切相關(guān)的步驟: 在系統(tǒng)的耦合和擴展區(qū)域中使用的光柵幾何結(jié)構(gòu)的優(yōu)化
    發(fā)表于 12-20 10:27

    光波導(dǎo)系統(tǒng)中光柵幾何結(jié)構(gòu)的優(yōu)化

    快速物理光學(xué)軟件VirtualLab Fusion擁有分析光波導(dǎo)系統(tǒng)性能。這次我們在設(shè)計工作流程中處理一個密切相關(guān)的步驟: 在系統(tǒng)的耦合和擴展區(qū)域中使用的光柵幾何結(jié)構(gòu)的優(yōu)化。 VirtualLab
    發(fā)表于 12-16 10:39

    TVP7002+THS8200 VGA輸出圖像出現(xiàn)垂直線條有鋸齒,是什么原因?qū)е碌模?/a>

    項目用到了TVP7002+THS8200,VGA輸出圖像出現(xiàn)垂直線條有鋸齒,初步定位在TVP7002這端,請問是什么原因?qū)е碌摹VP7002采用的是內(nèi)同步輸出BT1120, 逐行掃描
    發(fā)表于 12-12 07:41

    dac38j82 IOUTx為什么沒有波形輸出?

    一直為1即可得知鏈路已經(jīng)建立。 fpga發(fā)送的數(shù)據(jù)通過gtN_txdata[31:0] gtN_txcharisk[3:0]底層數(shù)據(jù)端口也可以監(jiān)測到; 讀取DAC的config108寄存器,其bit
    發(fā)表于 12-06 07:19

    低壓線性恒流LED恒流驅(qū)動芯片:用于洗墻燈和線條

    洗墻燈和線條燈是兩種常見的LED照明產(chǎn)品,它們都需要使用LED恒流驅(qū)動芯片來確保穩(wěn)定、可靠的電流供應(yīng),從而保證LED的使用壽命和亮度。 ? 洗墻燈樣式 對于洗墻燈而言,由于其發(fā)出的光線需要覆蓋較大
    的頭像 發(fā)表于 08-16 10:04 ?1810次閱讀