圖像到圖像的翻譯是一類視覺和圖形問題,其目標是學習輸入圖像和輸出圖像之間的映射。 它可以應(yīng)用到廣泛的應(yīng)用程序中,例如收集樣式轉(zhuǎn)移,對象變形,季節(jié)轉(zhuǎn)移和照片增強。
CycleGAN
使用周期一致的對抗網(wǎng)絡(luò)進行不成對的圖像到圖像翻譯(ICCV 2017)
論文/項目/語義學者
作者提出了一種在沒有配對示例的情況下學習將圖像從源域X轉(zhuǎn)換為目標域Y的方法。 目的是學習映射G:X→Y,從而利用對抗損失將來自G(X)的圖像分布與分布Y區(qū)分開。 由于此映射的約束嚴重不足,因此我們將其與反映射F:Y→X耦合,并引入循環(huán)一致性損失以強制執(zhí)行F(G(X))≈X(反之亦然)。
成對的訓練數(shù)據(jù)(左)由訓練示例構(gòu)成,它們具有一對一的對應(yīng)關(guān)系。 未配對的訓練集沒有這種對應(yīng)關(guān)系(摘自本文)
圖取自本文。
該模型包含兩個映射函數(shù)G:X→Y和F:Y→X,以及相關(guān)的對抗標識符DY和DX。 DY鼓勵G將X轉(zhuǎn)換為與域Y不可區(qū)分的輸出,反之亦然,對于DX,F(xiàn)和X則相反。 為了進一步規(guī)范化映射,他們引入了兩個"周期一致性損失",這些損失捕捉了直覺,即如果我們從一個域轉(zhuǎn)換到另一個域然后再次返回,我們應(yīng)該到達起點。
StarGAN
用于多域圖像到圖像轉(zhuǎn)換的統(tǒng)一生成對抗網(wǎng)絡(luò)(CVPR 2018)
論文/代碼/語義學者
現(xiàn)有的圖像到圖像轉(zhuǎn)換方法在處理兩個以上的域時具有有限的可擴展性和魯棒性,因為應(yīng)該為每對圖像域分別構(gòu)建不同的模型。 StarGAN是一種新穎且可擴展的方法,可以僅使用一個模型就可以對多個域執(zhí)行圖像到圖像的轉(zhuǎn)換。
跨域模型與我們提出的模型StarGAN之間的比較。 (a)要處理多個域,應(yīng)為每對圖像域建立跨域模型。 (b)StarGAN能夠使用一個生成器來學習多個域之間的映射。 該圖表示連接多個域的星形拓撲。(摘自本文)
StarGAN概述,由兩個模塊(鑒別器D和生成器G)組成。(a)D學會區(qū)分真實圖像和偽圖像,并將真實圖像分類到其對應(yīng)的域。 (b)G接受圖像和目標域標簽作為輸入,并生成偽圖像。 目標域標簽在空間上復制并與輸入圖像連接在一起。 給定原始域標簽,?G嘗試從偽造圖像中重建原始圖像。 (d)G試圖生成與真實圖像沒有區(qū)別的圖像,并被D分類為目標域。
-
深度學習
+關(guān)注
關(guān)注
73文章
5561瀏覽量
122799
發(fā)布評論請先 登錄
圖像采集卡:機器視覺與專業(yè)成像的關(guān)鍵橋梁

HarmonyOS應(yīng)用圖像stride處理方案

基于RV1126開發(fā)板實現(xiàn)自學習圖像分類方案

圖像采集卡:現(xiàn)代圖像處理技術(shù)的關(guān)鍵組件

SLAMTEC Aurora:把深度學習“卷”進機器人日常
FPGA圖像處理基礎(chǔ)----實現(xiàn)緩存卷積窗口

基于FPGA實現(xiàn)圖像直方圖設(shè)計

傅立葉變換在圖像處理中的作用
AI圖像識別攝像機

GPU深度學習應(yīng)用案例
AI大模型在圖像識別中的優(yōu)勢
基于FPGA+GPU異構(gòu)平臺的遙感圖像切片解決方案

深度識別算法包括哪些內(nèi)容
圖像處理器是什么意思
AI入門之深度學習:基本概念篇

評論