一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SLAM/SfM相似非回環(huán)場(chǎng)景應(yīng)該如何處理?

3D視覺(jué)工坊 ? 來(lái)源:3D視覺(jué)工坊 ? 2023-09-20 15:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:泡椒味的口香糖

0. 筆者個(gè)人體會(huì)

相似結(jié)構(gòu)一直是SLAM和SfM中很難處理卻又不得不處理的問(wèn)題,如果機(jī)器人遇到了非常相似但實(shí)際不同的結(jié)構(gòu),很容易因?yàn)槠ヅ鋽?shù)量足夠多而引發(fā)假陽(yáng)性回環(huán)和重建失敗。傳統(tǒng)方法更多的還是利用匹配數(shù)量的閾值或者和其他幾何關(guān)系的比值閾值來(lái)判斷,這種方法在遇到高對(duì)稱(chēng)結(jié)構(gòu)時(shí)很容易失敗。

今天筆者將為大家?guī)?lái)這個(gè)問(wèn)題新的解決思路,也就是ICCV 2023 Oral提出的Doppelgangers,能夠自動(dòng)判斷兩個(gè)視圖是相同的,還是僅僅是相似的。這個(gè)方案實(shí)際上是將視覺(jué)消歧問(wèn)題建模為圖像對(duì)上的二分類(lèi)任務(wù),并開(kāi)發(fā)了基于學(xué)習(xí)的解決方案和數(shù)據(jù)集。

1. 效果展示

以下是一些典型的相似結(jié)構(gòu),即便是使用人眼觀(guān)看,也很容易認(rèn)為是相同場(chǎng)景。而在SLAM和SfM遇到這類(lèi)場(chǎng)景時(shí),很容易觸發(fā)假陽(yáng)性回環(huán)而導(dǎo)致跟蹤丟失或重建失敗。

Doppelgangers這篇文章主要解決的就是這類(lèi)場(chǎng)景下的匹配和重建問(wèn)題,即便用來(lái)重建的場(chǎng)景具有高度對(duì)稱(chēng)和相似的結(jié)構(gòu),仍然可以進(jìn)行完整的三維重建,不會(huì)憑空多或者少一些結(jié)構(gòu)。

618d9074-569d-11ee-939d-92fbcf53809c.png

61a4543a-569d-11ee-939d-92fbcf53809c.png

2. 摘要

我們考慮視覺(jué)消歧任務(wù),即判斷一對(duì)視覺(jué)相似的圖像是否描繪了相同或不同的三維表面(例如,對(duì)稱(chēng)建筑物的同側(cè)或?qū)?cè))。虛假圖像匹配,即兩幅圖像觀(guān)察到不同但視覺(jué)上相似的3D表面,對(duì)人類(lèi)區(qū)分具有挑戰(zhàn)性,也會(huì)導(dǎo)致3D重建算法產(chǎn)生錯(cuò)誤的結(jié)果。我們提出了一種基于學(xué)習(xí)的視覺(jué)消歧方法,將其建模為圖像對(duì)上的二分類(lèi)任務(wù)。為此,我們?yōu)樵搯?wèn)題引入了一個(gè)新的數(shù)據(jù)集Doppelgangers,該數(shù)據(jù)集包含了具有真實(shí)標(biāo)簽的相似結(jié)構(gòu)的圖像對(duì)。我們還設(shè)計(jì)了一種網(wǎng)絡(luò)架構(gòu),將局部關(guān)鍵點(diǎn)和匹配的空間分布作為輸入,從而可以更好地對(duì)局部和全局線(xiàn)索進(jìn)行推理。我們的評(píng)估表明,我們的方法可以在困難的情況下區(qū)分誤匹配,并且可以集成到SfM流水線(xiàn)中,以產(chǎn)生正確的、無(wú)二義性的三維重建。

3. 算法解析

現(xiàn)在一步步來(lái)拆解任務(wù):我們希望在做SLAM和SfM時(shí),即便遇到了結(jié)構(gòu)非常相似的場(chǎng)景,也能夠正確進(jìn)行三維重建和跟蹤,不能出現(xiàn)誤匹配導(dǎo)致重建結(jié)果突然多了一塊或少了一塊,更不能出現(xiàn)假陽(yáng)性回環(huán)。

具體任務(wù)描述:

給定兩幅非常相似的圖像,判斷它們是同一個(gè)結(jié)構(gòu)的同一個(gè)表面,還是兩個(gè)不同的3D結(jié)構(gòu)(作者將其稱(chēng)為doppelgangers)。主要發(fā)生在對(duì)稱(chēng)建筑物、重復(fù)視覺(jué)元素、以及多個(gè)相同地標(biāo)場(chǎng)景中。

分析發(fā)現(xiàn),雖然從高度對(duì)稱(chēng)建筑拍攝的兩幅圖像整體很相似,很難直接通過(guò)圖像對(duì)來(lái)進(jìn)行正負(fù)判別,但是它內(nèi)部還是有一些細(xì)節(jié)是不同的。這些細(xì)節(jié)所在的區(qū)域在進(jìn)行圖像匹配時(shí)的匹配關(guān)系很少,利用這種細(xì)微差異就可以區(qū)分圖像。其實(shí)這樣很符合人類(lèi)"找不同"的思路。

基于這個(gè)發(fā)現(xiàn),作者就提出了一種基于學(xué)習(xí)的方法來(lái)消除視覺(jué)歧義,并且還公開(kāi)了一個(gè)具有相似結(jié)構(gòu)的數(shù)據(jù)集,數(shù)據(jù)集還有GT標(biāo)簽。

這個(gè)相似場(chǎng)景識(shí)別算法的原理是,首先使用RANSAC估計(jì)基礎(chǔ)矩陣并過(guò)濾異常匹配(具體實(shí)驗(yàn)是直接使用LoFTR+RANSAC計(jì)算匹配),將原圖、提取的特征點(diǎn)、匹配到的特征點(diǎn)輸入到網(wǎng)絡(luò)中,輸出為相似圖像的概率,將相似性識(shí)別轉(zhuǎn)換為一個(gè)二分類(lèi)問(wèn)題。

這個(gè)算法的思想是使用關(guān)鍵點(diǎn)和匹配位置為網(wǎng)絡(luò)提供信息,這樣網(wǎng)絡(luò)不僅知道哪些關(guān)鍵點(diǎn)被匹配了,也可以知道哪些關(guān)鍵點(diǎn)沒(méi)有匹配,這樣對(duì)應(yīng)的區(qū)域可能就代表信息缺失或者不同目標(biāo),相當(dāng)于利用了關(guān)鍵點(diǎn)和匹配的空間分布信息。很明顯,視覺(jué)上具有相似結(jié)構(gòu)區(qū)域的匹配會(huì)更稠密,但不同結(jié)構(gòu)的區(qū)域匹配更稀疏。

而且為了更好得比較不同結(jié)構(gòu)區(qū)域,作者還對(duì)輸入圖像對(duì)進(jìn)行了幾何對(duì)齊,也就是估計(jì)仿射變換,然后warp圖像和二值mask。當(dāng)然,這個(gè)對(duì)齊不一定特別準(zhǔn),只不過(guò)希望能夠更好得聯(lián)系將兩個(gè)重疊區(qū)域。

到具體訓(xùn)練這一塊,作者還使用了Focal loss。這個(gè)也很容易理解,相似結(jié)構(gòu)的特征點(diǎn)匹配肯定是正負(fù)樣本不平衡的,使用Focal loss可以提高難分樣本的貢獻(xiàn)。

4. 實(shí)驗(yàn)

用來(lái)做二分類(lèi)的網(wǎng)絡(luò)結(jié)構(gòu)很簡(jiǎn)單,就是3個(gè)殘差模塊,一個(gè)平均池化,再加上一個(gè)全連接層。也僅僅訓(xùn)練了10個(gè)epoch,batch size設(shè)置為16,學(xué)習(xí)率從0.0005降低到0.000005。

實(shí)驗(yàn)主要是在他們提出的Doppelgangers數(shù)據(jù)集上評(píng)估消除視覺(jué)歧義的性能,然后將訓(xùn)練的圖像二分類(lèi)器集成到SfM中,通過(guò)重建效果來(lái)評(píng)估消歧性能,最后搞了一個(gè)消融實(shí)驗(yàn)來(lái)證明每個(gè)模塊都是有用的。

首先是僅使用局部特征匹配來(lái)預(yù)測(cè)圖像對(duì)是否為正(真)的匹配,對(duì)比的baseline包括SIFT+RANSAC、LoFTR、以及DINO-ViT(自監(jiān)督SOTA分類(lèi)/分割器)。作者使用的匹配方式包括兩種:( 1 )對(duì)幾何驗(yàn)證后的匹配數(shù)量進(jìn)行閾值化處理;( 2 )對(duì)匹配數(shù)量與關(guān)鍵點(diǎn)數(shù)量的比值進(jìn)行閾值化處理。( 2 )背后的思想是,如果相對(duì)于關(guān)鍵點(diǎn)的數(shù)量,有很少的匹配,則很可能是誤匹配。作者訓(xùn)練的模型AP為95.2 %,ROC AUC為93.8 %。DINO結(jié)果不太好,主要是因?yàn)樗傻奶卣骱苓m合語(yǔ)義分類(lèi)任務(wù),但不適合視覺(jué)消歧。

61e80f22-569d-11ee-939d-92fbcf53809c.png

測(cè)試的圖像對(duì)和對(duì)應(yīng)的正匹配概率,這個(gè)定性對(duì)比還是很詳細(xì)的,實(shí)驗(yàn)的場(chǎng)景很多。左欄表示負(fù)對(duì)匹配關(guān)系(錯(cuò)誤),右欄表示正對(duì)(正確)。比較亮眼的是,在不同光照、視角變化、天氣變化等挑戰(zhàn)性情況下,也可正確分類(lèi)正負(fù)匹配關(guān)系。

后面就開(kāi)始搞三維重建了,作者將他們訓(xùn)練的二分類(lèi)器集成到COLMAP中,以此來(lái)評(píng)估在重復(fù)/對(duì)稱(chēng)場(chǎng)景中的三維重建效果。使用的landmark有兩類(lèi),包含13個(gè)由于對(duì)稱(chēng)和重復(fù)結(jié)構(gòu)而難以重建的landmark,還有與訓(xùn)練數(shù)據(jù)有顯著差異的3個(gè)具有重復(fù)結(jié)構(gòu)的場(chǎng)景,主要是為了測(cè)試泛化性。

下面這個(gè)表就是SfM的重建結(jié)果,第二列代表數(shù)據(jù)集中的場(chǎng)景數(shù)量,其他的√和代表是否重建成功,是否成功是與谷歌地球中相應(yīng)結(jié)構(gòu)對(duì)比得到的(評(píng)估三維重建效果的新點(diǎn)?)。

621846c4-569d-11ee-939d-92fbcf53809c.png

下面是直接使用COLMAP重建的模型和作者提出方法重建效果的對(duì)比。顯然,直接使用COLMAP會(huì)憑空產(chǎn)生很多多余的塔樓、穹頂?shù)冉Y(jié)構(gòu)。但是作者提出的方法可以很好得消除這種對(duì)稱(chēng)相似結(jié)構(gòu)的"語(yǔ)義歧義",從而重建完整的三維模型。

622c8f80-569d-11ee-939d-92fbcf53809c.png

最后是一個(gè)消融實(shí)驗(yàn),就沒(méi)啥可說(shuō)的了,主要對(duì)比了使用不同的網(wǎng)絡(luò)結(jié)構(gòu)做二分類(lèi)器、書(shū)否有數(shù)據(jù)增強(qiáng),以及不同網(wǎng)絡(luò)輸入帶來(lái)的性能對(duì)比。

6249b1f0-569d-11ee-939d-92fbcf53809c.png

5. 總結(jié)

Doppelgangers是解決特定任務(wù)的一篇文章,實(shí)現(xiàn)了相似結(jié)構(gòu)的二分類(lèi),解決的問(wèn)題很重要。雖然Doppelgangers的實(shí)驗(yàn)更多的面向圖像匹配和SfM,但筆者個(gè)人覺(jué)得也很容易應(yīng)用到SLAM場(chǎng)景中,感興趣的小伙伴可以做進(jìn)一步的嘗試。

編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29748

    瀏覽量

    212906
  • SLAM
    +關(guān)注

    關(guān)注

    24

    文章

    441

    瀏覽量

    32505
  • 分類(lèi)器
    +關(guān)注

    關(guān)注

    0

    文章

    153

    瀏覽量

    13451
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25449

原文標(biāo)題:ICCV 2023 oral | 一文看懂SLAM/ SfM遇到相似非回環(huán)場(chǎng)景應(yīng)該如何處理

文章出處:【微信號(hào):3D視覺(jué)工坊,微信公眾號(hào):3D視覺(jué)工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    貿(mào)澤電子開(kāi)售醫(yī)療用Sensirion SFM3003和SFM3013流量計(jì)

    貿(mào)澤電子 (Mouser Electronics) 即日起開(kāi)售Sensirion的SFM全系列數(shù)字流量計(jì),包括SFM3003和SFM3013流量計(jì)。
    發(fā)表于 12-21 14:05 ?2226次閱讀
    貿(mào)澤電子開(kāi)售醫(yī)療用Sensirion <b class='flag-5'>SFM</b>3003和<b class='flag-5'>SFM</b>3013流量計(jì)

    淺談SLAM回環(huán)檢測(cè)技術(shù)

    回環(huán)的,對(duì)于SLAM來(lái)說(shuō)也可以通過(guò)對(duì)比當(dāng)前幀與過(guò)去關(guān)鍵幀的相似度,如相似度超過(guò)某一閥值時(shí)就可以被認(rèn)為是檢測(cè)到回環(huán)?,F(xiàn)在,問(wèn)題的關(guān)鍵就在于如
    發(fā)表于 10-23 17:47

    SLAM技術(shù)的應(yīng)用及發(fā)展現(xiàn)狀

    應(yīng)用行業(yè)也可分為兩大類(lèi),即工業(yè)領(lǐng)域和商業(yè)領(lǐng)域。商業(yè)用途方面,目前應(yīng)用最為成熟的應(yīng)該是掃地機(jī)行業(yè),而掃地機(jī)也算機(jī)器人里最早用到SLAM技術(shù)這一批了,國(guó)內(nèi)的科沃斯、塔米掃地機(jī)、嵐豹掃地機(jī)通過(guò)用SLAM算法
    發(fā)表于 12-06 10:25

    讓機(jī)器人完美建圖的SLAM 3.0到底是何方神圣?

    圖引擎,讓機(jī)器人在復(fù)雜、大面積的場(chǎng)景下也能輕松應(yīng)對(duì),穩(wěn)定發(fā)揮,完成定位導(dǎo)航任務(wù)。 傳統(tǒng)SLAMSLAM 3.0的建圖對(duì)比:    -建圖精度高,圖優(yōu)化式建圖  - 主動(dòng)閉環(huán)修正  - 建圖穩(wěn)定、不
    發(fā)表于 01-21 10:57

    SLAM大法之回環(huán)檢測(cè)

    SLAM 3.0 算是提升機(jī)器人回環(huán)檢測(cè)能力的一大突破。  SLAM 3.0采用圖優(yōu)化的方式進(jìn)行建圖,進(jìn)行了圖片集成與優(yōu)化處理,當(dāng)機(jī)器人運(yùn)動(dòng)到已經(jīng)探索過(guò)的原環(huán)境時(shí),
    發(fā)表于 03-06 15:38

    超全SLAM技術(shù)及應(yīng)用介紹

    運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)(SfM)和 SLAM 所解決的問(wèn)題非常相似,但 SfM 傳統(tǒng)上是以離線(xiàn)形式進(jìn)行的,而 SLAM 則已經(jīng)慢慢走向了低功耗/實(shí)時(shí)/
    的頭像 發(fā)表于 11-22 14:34 ?1.8w次閱讀
    超全<b class='flag-5'>SLAM</b>技術(shù)及應(yīng)用介紹

    VIL-SLAM系統(tǒng)可實(shí)現(xiàn)獲得更好的回環(huán)約束

    本文提出的立體視覺(jué)+慣導(dǎo)+激光雷達(dá)的SLAM系統(tǒng),在比如隧道一些復(fù)雜場(chǎng)景下能夠?qū)崿F(xiàn)良好性能。VIL-SLAM通過(guò)將緊密耦合的立體視覺(jué)慣性里程計(jì)(VIO)與激光雷達(dá)建圖和激光雷達(dá)增強(qiáng)視覺(jué)環(huán)路閉合相結(jié)合
    發(fā)表于 02-18 17:59 ?2586次閱讀
    VIL-<b class='flag-5'>SLAM</b>系統(tǒng)可實(shí)現(xiàn)獲得更好的<b class='flag-5'>回環(huán)</b>約束

    一種適用于動(dòng)態(tài)場(chǎng)景SLAM方法

    的目標(biāo)檢測(cè)算法引入到經(jīng)典ORB_SLAM2方法中,將特征點(diǎn)分為潛在動(dòng)態(tài)特征點(diǎn)和潛在動(dòng)態(tài)特征點(diǎn),基于潛在動(dòng)態(tài)特征點(diǎn)計(jì)算運(yùn)動(dòng)模型,篩選岀應(yīng)用場(chǎng)景中的靜態(tài)特征點(diǎn)并實(shí)現(xiàn)位姿跟蹤,利用
    發(fā)表于 03-18 10:39 ?21次下載
    一種適用于動(dòng)態(tài)<b class='flag-5'>場(chǎng)景</b>的<b class='flag-5'>SLAM</b>方法

    移動(dòng)機(jī)器人視覺(jué)SLAM回環(huán)檢測(cè)原理、現(xiàn)狀及趨勢(shì)

    目前視覺(jué)SLAM回環(huán)檢測(cè)主要方式有傳統(tǒng)的詞袋模型以及基于概率和詞袋模型的一些改進(jìn)算法,但是傳統(tǒng)方式依然存在過(guò)多的人工干預(yù),對(duì)于場(chǎng)景中動(dòng)態(tài)對(duì)象的處理不是十分理想,并且計(jì)算量較大,響應(yīng)比較
    的頭像 發(fā)表于 11-09 12:38 ?2633次閱讀

    關(guān)于視覺(jué)SLAM直接法的介紹

    而關(guān)于SLAM,它是英文“同時(shí)定位與建圖”的縮寫(xiě)。而有時(shí)候,我們還會(huì)聽(tīng)到VO,SfM等概念,而因此容易混淆。
    的頭像 發(fā)表于 11-30 09:22 ?1500次閱讀

    Global SfM和ncremental SfM知識(shí)講解

    Sfm 可以分為以下幾類(lèi):Global SfM、Incremental SfM、Hybrid SfM、Distributed SfM,這里主
    的頭像 發(fā)表于 12-30 09:16 ?2456次閱讀

    OV2SLAM(高速視覺(jué)slam)簡(jiǎn)析

    視覺(jué)里程計(jì)最近幾年越來(lái)越受到學(xué)術(shù)界以及工業(yè)界的認(rèn)可,以O(shè)RB和VINS為代表的視覺(jué)SLAM已經(jīng)可以滿(mǎn)足絕大多數(shù)場(chǎng)景,而OV2SLAM在其他VSLAM中脫穎而出,其實(shí)時(shí)性以及具體的回環(huán)
    的頭像 發(fā)表于 03-21 17:16 ?2174次閱讀

    基于特征點(diǎn)的SfM在弱紋理場(chǎng)景下的表現(xiàn)

    SfM是指給定一組無(wú)序圖像,恢復(fù)出相機(jī)位姿以及場(chǎng)景點(diǎn)云。通用場(chǎng)景下的SfM效果已經(jīng)很好,而且COLMAP這類(lèi)框架也很好用。但是弱紋理和無(wú)紋理場(chǎng)景
    的頭像 發(fā)表于 08-21 09:22 ?2624次閱讀
    基于特征點(diǎn)的<b class='flag-5'>SfM</b>在弱紋理<b class='flag-5'>場(chǎng)景</b>下的表現(xiàn)

    3D重建的SLAM方案算法解析

    GO-SLAM主要還是基于NeRF進(jìn)行稠密重建,可以發(fā)現(xiàn)相較于NICE-SLAM這些SOTA方案,GO-SLAM重建場(chǎng)景的全局一致性更好,這主要是因?yàn)樗肓?/div>
    發(fā)表于 09-11 10:03 ?1953次閱讀
    3D重建的<b class='flag-5'>SLAM</b>方案算法解析

    導(dǎo)熱油管道漏油應(yīng)該何處理

    電子發(fā)燒友網(wǎng)站提供《導(dǎo)熱油管道漏油應(yīng)該何處理.docx》資料免費(fèi)下載
    發(fā)表于 03-06 15:41 ?0次下載