一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

圖像修復與處理經(jīng)典論文回顧和精讀

OpenCV學堂 ? 來源:OpenCV學堂 ? 作者:OpenCV學堂 ? 2022-07-13 16:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

筆者最近在集中時間學習對抗生成網(wǎng)絡(GAN),特別是深度生成先驗進行多用途圖像修復與處理,需要對圖像修復與處理經(jīng)典論文進行回顧和精讀。

將從圖像修復與處理的經(jīng)典之作DGP《Exploiting Deep Generative Prior for Versatile Image Restoration and Manipulation》開始,重啟精讀之路。

d4193df6-0283-11ed-ba43-dac502259ad0.png

DGP提出了一種挖掘GAN中圖像先驗的方式,在多個任務上揭示了GAN作為一種通用圖像先驗的潛力。

論文提出了同時插值隱變量和生成器的漸變式圖像反演方法,可以應用于復雜圖片的對抗防御,在實驗中DGP所展現(xiàn)出的強大的像素間空間關系模擬能力也十分有趣。

d43f1a1c-0283-11ed-ba43-dac502259ad0.gif

Deep generative prior的圖像復原效果

01深度生成先驗

深度圖像先驗DIP僅依靠輸入圖像的統(tǒng)計信息,無法應用于需要更一般的圖像統(tǒng)計信息的任務,如圖像上色和圖像編輯。

d46d2f42-0283-11ed-ba43-dac502259ad0.png

我們更感興趣的是研究一種更通用的圖像先驗,即在大規(guī)模自然圖像上訓練的GAN生成器用于圖像合成。具體來說,是一個基于GAN-inversion的圖像重構(gòu)過程。

在實踐中,僅僅通過優(yōu)化隱向量z難以準確重建ImageNet這樣的復雜真實圖像。訓練GAN的數(shù)據(jù)集(ImageNet)本身是自然圖片中很少的一部分,GAN受限于有限的模型性能和mode collapse,其模擬的圖片分布與訓練集圖片分布也存在鴻溝。

即使存在以上限制,GAN仍然學習了豐富的圖片信息,為了利用這些信息并且實現(xiàn)精確重建,我們讓生成器online地適應于每張目標圖片,即聯(lián)合優(yōu)化隱向量z和生成器參數(shù)。

d4926fdc-0283-11ed-ba43-dac502259ad0.png

我們將此新的目標稱為深度生成先驗(DGP),DGP顯著提高了圖像重構(gòu)的效果。設計合適的距離度量和優(yōu)化策略非常關鍵,在重建過程中,生成器原始的生成先驗被修改了,輸出真實自然圖像的能力可能會下降。

02判別器指引的漸進式重建

從 latent space Z 中隨機抽取幾百個候選的初始 latent code,并選擇在度量L下重構(gòu)效果最好的一個。

在GAN重建中,傳統(tǒng)的距離度量方法是 MSE 或 Perceptual loss。優(yōu)化生成器參數(shù)時,將這些傳統(tǒng)距離度量用在圖像恢復如上色任務中,常常無法準確恢復顏色,并且重建過程中圖像會變得模糊,需要設計更好的優(yōu)化方式來保留生成器的原有信息。

我們在該工作中選擇使用與生成器對應的判別器來作為距離度量。與Perceptual loss所采用的VGGNet不同,判別器并非在一個第三方的任務上訓練,而是在預訓練時就與生成器高度耦合,它天然地適用于調(diào)整生成器的輸出分布。

使用這種基于判別器的距離度量時,重建的過程更加自然和真實,最終顏色恢復的效果也更好。

d4c46f50-0283-11ed-ba43-dac502259ad0.png

其中D(x, i)代表以x作為輸入時判別器第i個block輸出的特征

雖然改進的距離度量帶來了更好的效果,但是圖像復原的結(jié)果仍存在非自然痕跡,因為生成器在針對目標圖片優(yōu)化時,淺層參數(shù)匹配好圖片整體布局之前,深層參數(shù)就開始匹配細節(jié)紋理了。

d4d8fee8-0283-11ed-ba43-dac502259ad0.png

上面的蘋果圖是幾種訓練策略的對比,從三行效果可以看出,有的蘋果在訓練初期沒被染上色后期還是沒被染上色,我們把這種現(xiàn)象稱作“信息滯留”。

對策就是:使用漸進式重建的策略,即在微調(diào)生成器時,先優(yōu)化淺層,再逐漸過渡到深層,讓重建過程“先整體后局部”。

與非漸進策略相比,這種漸進策略更好地保留了缺失語義和現(xiàn)有語義之間的一致性。

d4ee357e-0283-11ed-ba43-dac502259ad0.png

03重建結(jié)果

使用BigGAN模型,基于ImageNet進行訓練,使用ImageNet驗證集中的1000張圖像進行實驗,取每類的第一張,相比于其他方法,DGP取得了非常高的PSNR和SSIM,視覺上的重建誤差幾乎難以察覺。

d51bea28-0283-11ed-ba43-dac502259ad0.png

04實驗

因為GAN刻畫了自然圖像的先驗,因此可以完成很多的任務:比如上色、補全、超分辨率等等,還能進行圖像處理。下面放一些效果圖。

圖像上色

使用ResNet50上的分類精度作為定量評估結(jié)果, 下列方法的精度分別為 51.5%, 56.2%, 56.0%, 62.8%。

d56bab58-0283-11ed-ba43-dac502259ad0.png

圖像補全

d58cc4f0-0283-11ed-ba43-dac502259ad0.png

超分辨率

d5b1deb6-0283-11ed-ba43-dac502259ad0.png

靈活性

d5c8ecdc-0283-11ed-ba43-dac502259ad0.png

隨機擾動

d5e3a16c-0283-11ed-ba43-dac502259ad0.png

總結(jié)

GAN作為圖像領域最強大的生成式模型之一,學習到了豐富的自然圖像流形,可以對自然圖像的恢復和編輯帶來巨大幫助。

利用好大規(guī)模預訓練模型的能力是深度學習目前各個領域的流行前沿,可以減少對訓練數(shù)據(jù)的需求,整合相近的研究領域。

未來更強大的生成式模型,將帶來更具實際應用價值的圖像恢復和編輯應用,有望在更廣泛的領域落地

d609a812-0283-11ed-ba43-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • GaN
    GaN
    +關注

    關注

    19

    文章

    2209

    瀏覽量

    76813
  • 生成器
    +關注

    關注

    7

    文章

    322

    瀏覽量

    21901
  • 圖像修復
    +關注

    關注

    0

    文章

    11

    瀏覽量

    2315

原文標題:深度學習論文精讀[GAN]:利用深度生成先驗進行多用途圖像修復與處理

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    圖像采集卡:現(xiàn)代圖像處理技術(shù)的關鍵組件

    在現(xiàn)代科技快速發(fā)展的背景下,圖像處理技術(shù)已成為信息技術(shù)領域不可或缺的一部分。圖像采集卡,作為連接計算機與各種圖像采集設備的重要硬件組件,扮演著至關重要的角色。它不僅涉及
    的頭像 發(fā)表于 02-20 10:42 ?489次閱讀
    <b class='flag-5'>圖像</b>采集卡:現(xiàn)代<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>技術(shù)的關鍵組件

    FPGA上的圖像處理算法集成與優(yōu)化

    本文詳細介紹了多種圖像處理技術(shù),包括RG/GB單通道提取、亮度和對比度調(diào)整、圖像反轉(zhuǎn)、均值濾波、高斯濾波、圖像銳化、中值濾波、閾值分割、邊緣檢測(Sobel算子)、
    的頭像 發(fā)表于 02-14 13:46 ?658次閱讀
    FPGA上的<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>算法集成與優(yōu)化

    FPGA圖像處理基礎----實現(xiàn)緩存卷積窗口

    像素行與像素窗口 一幅圖像是由一個個像素點構(gòu)成的,對于一幅480*272大小的圖片來說,其寬度是480,高度是272。在使用FPGA進行圖像處理時,最關鍵的就是使用FPGA內(nèi)部的存儲資源對像
    的頭像 發(fā)表于 02-07 10:43 ?829次閱讀
    FPGA<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>基礎----實現(xiàn)緩存卷積窗口

    CMOS傳感器的圖像處理能力

    隨著科技的飛速發(fā)展,圖像處理技術(shù)已經(jīng)成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠?。CMOS傳感器作為圖像捕捉的核心,其圖像處理能力直接影響到成像質(zhì)量。
    的頭像 發(fā)表于 01-20 15:19 ?756次閱讀

    DFT在圖像處理中的作用 DFT在音頻信號處理中的應用

    DFT在圖像處理中的作用 離散傅里葉變換(Discrete Fourier Transform,簡稱DFT)是一種將信號從時域轉(zhuǎn)換到頻域的數(shù)學工具,它在圖像處理領域有著廣泛的應用。以下
    的頭像 發(fā)表于 12-20 09:18 ?1259次閱讀

    傅立葉變換在圖像處理中的作用

    傅里葉變換在圖像處理中發(fā)揮著至關重要的作用。以下是傅里葉變換在圖像處理中的幾個主要作用: 一、圖像增強與去噪 去噪 :
    的頭像 發(fā)表于 12-06 16:55 ?2306次閱讀

    FPGA 實時信號處理應用 FPGA在圖像處理中的優(yōu)勢

    現(xiàn)場可編程門陣列(FPGA)是一種高度靈活的硬件平臺,它允許開發(fā)者根據(jù)特定應用需求定制硬件邏輯。在實時信號處理圖像處理領域,F(xiàn)PGA因其獨特的優(yōu)勢而受到青睞。 1. 并行處理能力 F
    的頭像 發(fā)表于 12-02 10:01 ?1820次閱讀

    經(jīng)典圖神經(jīng)網(wǎng)絡(GNNs)的基準分析研究

    本文簡要介紹了經(jīng)典圖神經(jīng)網(wǎng)絡(GNNs)的基準分析研究,發(fā)表在 NeurIPS 2024。 文章回顧經(jīng)典 GNNs 模型在節(jié)點分類任務上的表現(xiàn),結(jié)果發(fā)現(xiàn)過去 SOTA 圖學習模型報告的性能優(yōu)越
    的頭像 發(fā)表于 11-27 09:16 ?800次閱讀
    <b class='flag-5'>經(jīng)典</b>圖神經(jīng)網(wǎng)絡(GNNs)的基準分析研究

    傅里葉變換與圖像處理技術(shù)的區(qū)別

    在數(shù)字信號處理圖像分析領域,傅里葉變換和圖像處理技術(shù)是兩個核心概念。盡管它們在實際應用中常常交織在一起,但它們在本質(zhì)上有著明顯的區(qū)別。 傅里葉變換的基本原理 傅里葉變換是一種將信號從
    的頭像 發(fā)表于 11-14 09:30 ?834次閱讀

    LSTM神經(jīng)網(wǎng)絡在圖像處理中的應用

    長短期記憶(LSTM)神經(jīng)網(wǎng)絡是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(RNN),它能夠?qū)W習長期依賴關系。雖然LSTM最初是為處理序列數(shù)據(jù)設計的,但近年來,它在圖像處理領域也展現(xiàn)出了巨大的潛力。 LSTM基本原理
    的頭像 發(fā)表于 11-13 10:12 ?1621次閱讀

    FPGA在圖像處理領域的優(yōu)勢有哪些?

    FPGA(Field Programmable Gate Array,現(xiàn)場可編程門陣列)在圖像處理領域具有顯著的優(yōu)勢,這些優(yōu)勢主要體現(xiàn)在以下幾個方面: 一、高并行處理能力 FPGA內(nèi)部擁有大量的邏輯
    發(fā)表于 10-09 14:36

    盛顯科技:投影融合處理器如何實現(xiàn)圖像處理和融合?

    相信大家都知道,投影融合處理器實現(xiàn)融合投影功能的過程是一個復雜但高度專業(yè)化的技術(shù)過程,它主要依賴于先進的投影技術(shù)和圖像融合技術(shù),精妙地結(jié)合了尖端的投影技術(shù)與精細的圖像融合算法。那么您知道投影融合
    的頭像 發(fā)表于 09-26 18:14 ?681次閱讀
    盛顯科技:投影融合<b class='flag-5'>處理</b>器如何實現(xiàn)<b class='flag-5'>圖像</b>的<b class='flag-5'>處理</b>和融合?

    圖像處理器的發(fā)展歷史

    圖像處理器(Image Processor)的發(fā)展歷史是一段充滿創(chuàng)新與突破的歷程,它伴隨著計算機技術(shù)的不斷進步和圖像處理需求的日益增長而逐漸成熟。以下是對
    的頭像 發(fā)表于 08-14 09:42 ?1993次閱讀

    圖像處理器是什么意思

    圖像處理器(Image Processor)是一種專門用于圖像處理和計算的硬件設備或芯片,它通過高速數(shù)據(jù)傳輸、圖像編解碼、濾波、變換等多種技
    的頭像 發(fā)表于 08-14 09:28 ?1981次閱讀