泊松融合(Poisson Blending)又作 Seamless clone,用于將兩幅圖像“無縫”的融合起來,基本原理就是最優(yōu)化一個(gè)方程,盡量在和base邊界處保持相關(guān)的亮度,同時(shí)保留剪切過來圖像的梯度,這樣看起來兩張圖像就“無縫”拼合在一起了。
2004 年 SIGGRAPH 上,Microsoft Research UK 有篇經(jīng)典的圖像融合文章《Poisson Image Editing》。先看看其驚人的融合結(jié)果(非論文配圖,本人實(shí)驗(yàn)結(jié)果):
這篇文章的實(shí)現(xiàn),無關(guān)目前算法領(lǐng)域大火的神經(jīng)網(wǎng)絡(luò),而是基于泊松方程推導(dǎo)得出。
泊松方程是什么?
很多朋友比較熟悉概率論里面的泊松分布。泊松方程,也是同一個(gè)數(shù)學(xué)家泊松發(fā)明的。但卻和泊松分布沒有什么關(guān)系,是泊松物理學(xué)領(lǐng)域提出的一個(gè)偏微分方程。
這里表示的是拉普拉斯算子,和在泊松方程中是已知量,可以是實(shí)數(shù)或復(fù)數(shù)值方程,特殊情況當(dāng)時(shí)被稱為拉普拉斯方程。當(dāng)處于歐幾里得空間時(shí),拉普拉斯算子通常表示為。
學(xué)習(xí)圖像處理的朋友對于和比較熟悉,分別表示二階微分(直角坐標(biāo)系下的散度)、一階微分(直角坐標(biāo)系下的梯度)。
微分與卷積
連續(xù)空間中的微分計(jì)算,就是大學(xué)里微積分那一套公式。但是在計(jì)算機(jī)的世界里,數(shù)據(jù)都是在離散空間中進(jìn)行表示,對于圖像而言,基本的計(jì)算單元就是像素點(diǎn)。讓我們從最簡單的情形,一維數(shù)組的微分說起:
表示位置 x 一階微分計(jì)算(一階中心導(dǎo)):
表示位置x二階微分計(jì)算(二階中心導(dǎo)):
隨著h->0,上面的微分算式的結(jié)果會(huì)逐漸逼近真實(shí)的微分值。對于圖像而言,這里 h 最小可分割單元是像素,也就表示像素間的間距,可視為 1。再看看,二階微分的公式,是不是可以看成 1x3 的卷積核 [1,-2,1]在一維數(shù)組上進(jìn)行卷積計(jì)算的結(jié)果(卷積中心在 x 上)。
至此,不難理解,離散數(shù)據(jù)(例如圖像)上的微分操作完全可以轉(zhuǎn)換為卷積操作。
當(dāng)數(shù)組維度更高,變成二維數(shù)組呢?也就是處理圖像的拉普拉斯算子:
此時(shí),卷積核尺寸應(yīng)該是 3x3,具體數(shù)值為
稱為拉普拉斯卷積核。
記住拉普拉斯卷積核,我們后面會(huì)用到。
泊松方程求解
這個(gè)時(shí)候,想想我們學(xué)會(huì)了什么?泊松方程的形式,以及拉普拉斯卷積核。
再想想,在圖像場景下,什么是泊松方程的核心問題?
已知圖像點(diǎn)二階微分值(直角坐標(biāo)系下即散度div)的情況下,求解各個(gè)圖像點(diǎn)的像素值。
一個(gè)簡單的例子,假設(shè)有一張4x4的圖像 x:
Xi表示各個(gè)位置上的圖像像素值,共 16 個(gè)未知參數(shù)需要被求解。
應(yīng)用拉普拉斯卷積核后,得到 4 個(gè)方程式:
4 個(gè)方程式求解出 16 個(gè)未知參數(shù)?這是不可能的。
因此,我們需要另加入至少 12 個(gè)更多的方程式,也就是說,需要把剩余 12 個(gè)邊界點(diǎn)的值確定,即需要確定邊界條件。邊界一般符合 2 種常見的邊界條件:
Neumann 邊界,譯為紐曼邊界或黎曼邊界,給出函數(shù)在邊界處的二階導(dǎo)數(shù)值;
Dirichlet 邊界,狄利克雷邊界,給出邊界處函數(shù)在邊界處的實(shí)際值。
但給定邊界條件之后,就可以有 16 個(gè)方程式組成的方程組了,矩陣化表示此方程組之后,得到形式為 Ax=b。
看到Ax=b,大家就應(yīng)該放松了,不就是解方程嘛,用雅可比迭代法或者高斯賽德爾迭代法來求解就 OK 了。
Poisson Image Editing
背景知識儲(chǔ)備好了后,讓我們把目光拉回到論文《Poisson Image Editing》上。
在圖像融合任務(wù)中,前景放置在背景上時(shí),需要保證兩點(diǎn):
前景本身主要內(nèi)容相比于背景而言,盡量平滑;
邊界處無縫,即前景、背景在邊界點(diǎn)位置上的像素值,需要保持邊界一致。
重點(diǎn)關(guān)注兩個(gè)詞:內(nèi)容平滑、邊界一致。平滑是什么?可以理解成圖像前景、背景梯度相同。邊界一致是指什么?可以理解成在邊界上像素值相同。再用一張圖來說明:
藍(lán)色圖片表示前景圖片,需要被融合到肉色的背景圖片上
上圖中 u 表示需要被合成的前景圖片, V 是u的梯度場。S是背景圖片,是合并后目標(biāo)圖像中被前景所覆蓋的區(qū)域,則是的邊界。設(shè)合并后圖像在內(nèi)的像素表示函數(shù)是,在外的像素值表示函數(shù)是。
此時(shí),平滑可表示為:
保持邊界一致可表示為:
這里如果接觸過泛函的朋友會(huì)比較開心,沒接觸過的朋友可以先看看歐拉-拉格朗日方程。令
代入歐拉-拉格朗日方程后則有:
怎么樣,看起來是不是一個(gè)泊松方程呢?當(dāng)然,還差兩步:
因?yàn)樾枰?span style="font-weight:600;">平滑, div v 取值需要同時(shí)參考前景圖片和背景圖片,可以直接等于前景像素的散度,也可以在前景和背景在同一點(diǎn)像素的散度進(jìn)行某種組合得到(論文中在 Selection cloning 和 Selection editing 章節(jié)有討論各自合適的場景,但個(gè)人以為這里采取學(xué)習(xí)的方法應(yīng)該更魯棒,而不是用固定的策略來區(qū)分)。anyway, div v 是可以計(jì)算的已知量;
因?yàn)樾枰?span style="font-weight:600;">保持邊界一致,邊界條件上像素值等于背景圖片即可。當(dāng)然也可以做一些策略,但同樣也可以計(jì)算得到的已知量。
現(xiàn)在很輕松了,邊界條件已知、散度已知,在離散空間中求解泊松方程中的,參考上一節(jié)的求解過程即可。
代碼實(shí)現(xiàn)
函數(shù)代碼已經(jīng)收錄在了 OpenCV 的官方函數(shù)seamlessClone里:github source code
使用的時(shí)候,需要三張圖片:前景圖、背景圖、mask圖(指明前景圖中需要融合的區(qū)域,最簡單的就是直接等于前景圖大小的 mask,待融合區(qū)域是白色,其余位置黑色)。
下面我們使用 OpenCV 的 Python 接口來動(dòng)手試試,用到以下兩張圖以及一段代碼:

import cv2
import numpy as np
# Read images : src image will be cloned into dst
dst = cv2.imread("background.jpg")
obj= cv2.imread("foreground.jpg")
# Create an all white mask
mask = 255 * np.ones(obj.shape, obj.dtype)
# The location of the center of the src in the dst
width, height, channels = dst.shape
center = (height/2, width/2)
# Seamlessly clone src into dst and put the results in output
normal_clone = cv2.seamlessClone(obj, dst, mask, center, cv2.NORMAL_CLONE)
mixed_clone = cv2.seamlessClone(obj, dst, mask, center, cv2.MIXED_CLONE)
# Write results
cv2.imwrite("images/opencv-normal-clone-example.jpg", normal_clone)
cv2.imwrite("images/opencv-mixed-clone-example.jpg", mixed_clone)
最終效果如下:
審核編輯 :李倩
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103538 -
數(shù)組
+關(guān)注
關(guān)注
1文章
420瀏覽量
26532
原文標(biāo)題:從泊松方程的解法,聊到泊松圖像融合
文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Matlab偏微分方程工具箱應(yīng)用說明
電子學(xué)領(lǐng)域的基本電磁定律,歸納/總結(jié)/點(diǎn)評
嵌入式工控機(jī)保障港口靠泊零事故
計(jì)算機(jī)Fortran編程實(shí)現(xiàn)偏微分方程拉普拉斯變換
基于雙TDA4VM行泊一體方案
五點(diǎn)差分格式求解泊松方程并行算法的研究
基于計(jì)算機(jī)視覺的醫(yī)學(xué)圖像自動(dòng)識別技術(shù)研究_胡曉泊
基于數(shù)據(jù)驅(qū)動(dòng)緊框架圖像去噪模型

機(jī)器學(xué)習(xí):泊松分布與指數(shù)分布
pcb線路板銅泊概述和特點(diǎn)
基于泊松簇過程的毫米波異構(gòu)網(wǎng)絡(luò)模型

基于泊松方程的生成模型 PFGM
光的波動(dòng)性之泊松亮斑介紹
PCL泊松盤采樣具體流程

評論