1. 寫在前面
圖像匹配是SLAM和圖像檢索的核心任務(wù),但是傳統(tǒng)的圖像匹配很難處理遮擋問(wèn)題。今天筆者將為大家分享一篇曠視的開(kāi)源工作Occ2Net,使用3D Occupancy來(lái)解決遮擋問(wèn)題下的圖像匹配。
下面一起來(lái)閱讀一下這項(xiàng)工作~
2. 摘要
圖像匹配是各種視覺(jué)應(yīng)用中基本且關(guān)鍵的任務(wù),如同時(shí)定位與地圖構(gòu)建( Simultaneous Localization and Mapping,SLAM )和圖像檢索,這些應(yīng)用都需要精確的位姿估計(jì)。然而,現(xiàn)有的大多數(shù)方法忽略了由相機(jī)運(yùn)動(dòng)和場(chǎng)景結(jié)構(gòu)引起的物體之間的遮擋關(guān)系。在本文中,我們提出了一種新的圖像匹配方法Occ2Net,該方法使用3D占有率建模遮擋關(guān)系,并在遮擋區(qū)域中推斷匹配點(diǎn)。得益于占有率估計(jì)( Occupancy Estimation,OE )模塊中編碼的歸納偏差,它大大簡(jiǎn)化了多視圖一致3D表示的引導(dǎo),從而可以集成來(lái)自多個(gè)視圖的信息。它與一個(gè)遮擋感知( Occlusion-Aware,OA )模塊一起,結(jié)合了注意力層和旋轉(zhuǎn)對(duì)齊,以實(shí)現(xiàn)遮擋點(diǎn)和可見(jiàn)點(diǎn)之間的匹配。我們?cè)谡鎸?shí)世界和模擬數(shù)據(jù)集上評(píng)估了我們的方法,并在幾個(gè)指標(biāo)上展示了其優(yōu)于最先進(jìn)方法的性能,特別是在遮擋場(chǎng)景中。
3. 效果展示
先看一下問(wèn)題描述,( a )和( b )是從不同視點(diǎn)拍攝的圖像,而( c )顯示了遮擋區(qū)域的匹配過(guò)程。在( c )中,兩個(gè)顯示器顯示綠色和紅色的掩模,表示在( b )中可見(jiàn)但在( a )中被遮擋的區(qū)域。由于相機(jī)運(yùn)動(dòng),兩個(gè)圖像的視差很大。雖然存在大量的重疊區(qū)域,但大的視差導(dǎo)致了遮擋,很大程度上減少了可見(jiàn)匹配對(duì)的數(shù)量。通過(guò)使用Occ2Net提取一致的占用特征并在( a )和( b )之間進(jìn)行匹配,( a )中被遮擋的顯示器仍然可以在( b )中進(jìn)行匹配,從而使Occ2Net具備了在遮擋情況下進(jìn)行匹配的能力。
4. 具體原理是什么?
Occ2Net框架,通過(guò)隱式地模擬物體-遮擋關(guān)系,實(shí)現(xiàn)遮擋下的匹配。首先提取特征,然后應(yīng)用OA模塊獲得粗匹配塊,最后將精細(xì)特征與OE模塊中的3D占用估計(jì)相結(jié)合進(jìn)行精細(xì)匹配。
5. 和其他SOTA方法對(duì)比如何?
ScanNet、TartanAir-indoor、TartanAir-outdoor的匹配實(shí)例。綠色和黃色線條表示正確匹配,紅色線條(誤差大于10個(gè)像素)為錯(cuò)誤匹配。
位姿誤差的百分比AUC對(duì)比,Occ2Net最優(yōu)。
6. 總結(jié)
這篇文章提出了一種遮擋問(wèn)題下的圖像匹配方式,設(shè)計(jì)了一種網(wǎng)絡(luò)結(jié)構(gòu)Occ2Net,可以在一定程度上感知遮擋點(diǎn)的存在。Occ2Net使用特征提取來(lái)獲得多尺度的全局和位置特征,這些特征有助于猜測(cè)遮擋信息。OA模塊使用了注意力和旋轉(zhuǎn)對(duì)齊,這有助于在后期的由粗到精的過(guò)程中得到更多正確的匹配對(duì)。OE模塊使用3D占用估計(jì)結(jié)合精細(xì)特征進(jìn)行精細(xì)匹配。
審核編輯:黃飛
-
SLAM
+關(guān)注
關(guān)注
24文章
441瀏覽量
32505 -
圖像匹配
+關(guān)注
關(guān)注
0文章
21瀏覽量
8901
原文標(biāo)題:如何處理遮擋問(wèn)題下的圖像匹配?
文章出處:【微信號(hào):3D視覺(jué)工坊,微信公眾號(hào):3D視覺(jué)工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
3D LED液晶電視設(shè)計(jì)方案
3D圖像的速度控制
基于Dragonboard 410c平臺(tái)的機(jī)器3D視覺(jué)—攝像機(jī)標(biāo)定原理
基于ToF的3D活體檢測(cè)算法研究
浩辰3D的「3D打印」你會(huì)用嗎?3D打印教程
基于深度學(xué)習(xí)和3D圖像處理的精密加工件外觀缺陷檢測(cè)系統(tǒng)
3D圖像引擎,3D圖像引擎原理
平面人物秒變3D模式,圖片中的人物可以從平面中“跑出來(lái)”,動(dòng)起來(lái)
iPhone 12沒(méi)有3D屏幕無(wú)法顯示3D圖像?
谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

華為基于AI技術(shù)實(shí)現(xiàn)3D圖像數(shù)字服務(wù)
用于3D掃描的嵌入式圖像預(yù)處理

特斯拉的Occupancy Network占用網(wǎng)絡(luò)如何解決無(wú)法識(shí)別物體的難題呢?

評(píng)論