一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

一種適用于動態(tài)環(huán)境的實時RGB-D SLAM系統(tǒng)

INDEMIND ? 來源:INDEMIND ? 2025-07-04 15:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期用于視覺SLAM的3D高斯?jié)姙R(3DGS)技術在跟蹤和高保真建圖方面取得了顯著進展。然而,其順序優(yōu)化框架以及對動態(tài)物體的敏感性限制了其在現(xiàn)實場景中的實時性能和魯棒性。為此,我們提出了UP-SLAM,這是一種適用于動態(tài)環(huán)境的實時RGB-D SLAM系統(tǒng)。實驗結果表明,UP-SLAM在定位精度方面(高出59.8%)和渲染質(zhì)量方面(峰值信噪比高出4.57分貝)均優(yōu)于最先進的方法,同時保持實時性能,并在動態(tài)環(huán)境中生成可重復使用且無偽影的靜態(tài)地圖。

? 文章:

UP-SLAM: Adaptively Structured Gaussian SLAM with Uncertainty Prediction in Dynamic Environments

? 作者:

Wancai Zheng, Linlin Ou, Jiajie He, Libo Zhou, Xinyi Yu, Yan Wei

? 論文鏈接:

https://arxiv.org/abs/2505.22335

? 編譯:

INDEMIND

01 本文核心內(nèi)容

視覺SLAM是具身智能和虛擬現(xiàn)實的核心技術。傳統(tǒng)的SLAM算法通常假設環(huán)境是靜態(tài)的,這促進了眾多有效系統(tǒng)的開發(fā)。然而,這種假設限制了SLAM在動態(tài)現(xiàn)實環(huán)境中的適用性,從而阻礙了機器人技術及相關領域的進步。近期的SLAM方法利用物體檢測和多視圖幾何理論來降低動態(tài)物體的影響。盡管這些方法增強了系統(tǒng)在動態(tài)環(huán)境中的魯棒性,但它們嚴重依賴于對動態(tài)物體的先驗知識以及檢測算法的可靠性。高保真場景表示技術的進步,如神經(jīng)輻射場(NeRF)和3D高斯?jié)姙R(3DGS),激發(fā)了將不確定性建模引入3D重建的探索。

近期的研究表明,納入不確定性預測能夠顯著增強對瞬態(tài)場景元素的魯棒性。這些具有不確定性感知能力的模型即使在間歇性遮擋的情況下也能實現(xiàn)高質(zhì)量的重建。然而,這些方法依賴于有利條件,例如精確的相機姿態(tài)和稀疏的視角,這在使用連續(xù)幀輸入的SLAM系統(tǒng)中很難實現(xiàn)。為了解決這些挑戰(zhàn),我們提出了一種名為UP-SLAM的實時RGB-D SLAM系統(tǒng),用于動態(tài)環(huán)境中的穩(wěn)健姿態(tài)估計和靜態(tài)場景重建。

我們的方法將3DGS壓縮為由多個淺層多層感知機(MLP)編碼的結構化錨點。引入概率八叉樹以實現(xiàn)錨點的自適應調(diào)整,從而刪除由動態(tài)物體引起的冗余錨點。此外,通過將運動掩碼生成與地圖優(yōu)化解耦,UP-SLAM實現(xiàn)了同步跟蹤和建圖,支持實時定位。在跟蹤過程中,我們提出了一種無需訓練、基于優(yōu)化的多模態(tài)一致性估計方法,該方法融合了幾何線索與DINO特征,以實現(xiàn)有效的動態(tài)物體識別。在映射過程中,為了進一步增強動態(tài)條件下的重建效果,設計了一種利用正弦位置編碼的時間編碼器,將幀間信息嵌入到多層感知機(MLP)中,從而提高表示能力。此外,動態(tài)對象在不同幀中不一致的外觀和運動為不確定性預測提供了有價值的線索。因此,將魯棒的DINO特征輸入到淺層MLP中進行逐像素不確定性估計,從而實現(xiàn)連續(xù)的運動掩碼細化,并增強重建的魯棒性。

本文的貢獻可概括為:

?提出了一種不確定性感知的并行跟蹤與映射框架,無需依賴預定義的語義標注即可有效減輕動態(tài)干擾,從而構建高質(zhì)量、無偽影的靜態(tài)地圖。

?提出了一種具有概率八叉樹的自適應結構化3DGS場景表示,支持在動態(tài)環(huán)境中自動分配或修剪高斯基元。這種方法提高了定位精度并減小了模型大小。

?將方法整合到ORB-SLAM3中,并在多個數(shù)據(jù)集上進行了全面評估。此外,還引入了一種在動態(tài)環(huán)境中評估渲染質(zhì)量的協(xié)議。

?項目地址:https://aczheng-cai.github.io/up_slam.github.io/

02 方法架構

圖2展示了UP-SLAM系統(tǒng)的概覽。

be73f46a-52e3-11f0-b715-92fbcf53809c.png

UP-SLAM以一系列RGB和深度圖像作為輸入,并采用并行化的跟蹤和建圖架構來提高整體效率。在跟蹤線程中,系統(tǒng)執(zhí)行實時定位并生成用于建圖的關鍵幀。動態(tài)區(qū)域檢測由來自建圖線程的多模態(tài)殘差引導,從而實現(xiàn)穩(wěn)健且實時的跟蹤。建圖線程采用概率錨點來構建自適應結構化的3DGS表示,這在減小模型大小的同時提高了重建質(zhì)量。為了在動態(tài)環(huán)境中提高建圖質(zhì)量,從DINOv2中提取的穩(wěn)健2D視覺特征被蒸餾到3DGS表示中以構建多模態(tài)殘差,這些殘差監(jiān)督淺層MLP進行逐像素不確定性預測,并實現(xiàn)運動掩碼的持續(xù)優(yōu)化。

03 實驗結果

1. 實驗設置

為了證明所提方法的優(yōu)勢,我們將它與16種方法進行了比較,這些方法按以下類別劃分:

(a)經(jīng)典SLAM方法:ORB-SLAM3;

(b)經(jīng)典動態(tài)SLAM方法:ReFusion、DynaSLAM、EM-Fusion;

(c)基于NeRF的SLAM方法:iMAP、NICE-SLAM、Vox-Fusion、Co-SLAM、ESLAM;

(d)基于NeRF的動態(tài)SLAM:RoDyn-SLAM;

(e)基于3DGS的SLAM:Photo-SLAM、GS-SLAM、SplaTAM;

(f)基于3DGS的動態(tài)SLAM方法:DG-SLAM、Gassidy、WildGS-SLAM。

所有方法均使用動態(tài)數(shù)據(jù)集進行評估,具體包括TUMRGB-D數(shù)據(jù)集、波恩RGB-D數(shù)據(jù)集以及MoCapRGB-D數(shù)據(jù)集,此外還使用了一個靜態(tài)環(huán)境數(shù)據(jù)集ScanNet數(shù)據(jù)集。對于非開源方法,我們報告原始結果;對于開源方法,我們報告五次運行的平均結果。加粗字體表示最佳結果,下劃線表示次優(yōu)結果。我們從每個類別中選取了具有代表性的基線方法。

2. 跟蹤性能評估

動態(tài)場景

與DG-SLAM相比,我們的方法在定位精度上平均提高了59.8%。值得注意的是,如表2所示,其平均定位精度提高了84.7%,這主要是因為DG-SLAM基于歷史幾何信息實現(xiàn)了開放集能力,但在復雜的動態(tài)環(huán)境中不夠穩(wěn)健。盡管DynaSLAM在表3中表現(xiàn)良好,這是由于其預定義的動態(tài)物體處理策略,但在表1、2中出現(xiàn)了明顯的漂移。這種性能下降源于這些數(shù)據(jù)集中存在大量難以預先定義的動態(tài)物體,尤其是在表2和雨傘(Umb.)序列中。

be84e9f0-52e3-11f0-b715-92fbcf53809c.png

be90c9dc-52e3-11f0-b715-92fbcf53809c.png

靜態(tài)場景

在公開的靜態(tài)ScanNet數(shù)據(jù)集上對UP-SLAM進行評估,以檢驗其魯棒性。雖然動態(tài)物體識別被用于提高動態(tài)環(huán)境中的SLAM系統(tǒng)的魯棒性,但識別不準確可能會對靜態(tài)場景中的定位精度產(chǎn)生不利影響。如表5所示,我們的方法在定位精度上比為靜態(tài)環(huán)境設計的SLAM系統(tǒng)平均提高了10.2%。此外,它還實現(xiàn)了8.1%的提升。與同樣適用于動態(tài)場景的DG-SLAM相比,平均改進情況。結果表明,我們的方法在靜態(tài)和動態(tài)環(huán)境中均保持了強勁的性能。

bea155fe-52e3-11f0-b715-92fbcf53809c.png

3. 映射性能評估

如表6所示,我們的方法在渲染質(zhì)量方面取得了顯著提升,峰值信噪比(PSNR)平均提高了5.47分貝。Photo-SLAM的渲染質(zhì)量與WildGSSLAM相當,這主要得益于其在低動態(tài)序列(例如Ball_track和Mv_box2)中的魯棒性。然而,在高度動態(tài)的環(huán)境中,定位失敗削弱了渲染結果的實際意義。此外,DG-SLAM缺乏穩(wěn)健的高斯基元初始化策略,導致重建不完整,顯著降低了渲染質(zhì)量。圖4提供了渲染結果的視覺比較。兩種靜態(tài)SLAM方法,SplaTAM和Photo-SLAM,無法生成靜態(tài)地圖。DG-SLAM和單目動態(tài)SLAM方法WildGS-SLAM均存在不同程度的失敗。相比之下,UP-SLAM能夠有效去除動態(tài)物體,并構建出高保真、無偽影的靜態(tài)地圖。

beaf125c-52e3-11f0-b715-92fbcf53809c.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3517

    瀏覽量

    50385
  • SLAM
    +關注

    關注

    24

    文章

    441

    瀏覽量

    32491
  • 視覺
    +關注

    關注

    1

    文章

    163

    瀏覽量

    24358
  • 3維動態(tài)環(huán)境

    關注

    0

    文章

    2

    瀏覽量

    864

原文標題:高精度、高魯棒!面向動態(tài)環(huán)境的實時視覺SLAM,動態(tài)、靜態(tài)環(huán)境雙提升!

文章出處:【微信號:gh_c87a2bc99401,微信公眾號:INDEMIND】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    一種適用于模擬/數(shù)字混合信號環(huán)境的接地技術

    本文分享了一種適用于模擬/數(shù)字混合信號環(huán)境的接地技術。
    發(fā)表于 04-25 07:46

    一種適用于室內(nèi)復雜環(huán)境的高精度、環(huán)境自適應性強的定位算法

    摘要對于室內(nèi)復雜環(huán)境來說, 適用于室外定位的 GPS 系統(tǒng)和蜂窩移動網(wǎng)絡在室內(nèi)中的定位精度明顯惡化, 無法滿足室內(nèi)用戶精確定位的需求。因此, 研究一種
    發(fā)表于 08-18 08:12

    如何去開發(fā)款基于RGB-D相機與機械臂的三維重建無序抓取系統(tǒng)

    基于RGB-D相機與機械臂的三維重建無序抓取系統(tǒng)有哪些關鍵技術?如何去開發(fā)款基于RGB-D相機與機械臂的三維重建無序抓取系統(tǒng)?基于
    發(fā)表于 09-08 06:12

    一種適用于嵌入式系統(tǒng)的模塊動態(tài)加載技術

    嵌入式系統(tǒng)中的模塊動態(tài)加載技術摘要提出一種適用于嵌入式系統(tǒng)的模塊動態(tài)加載技術,設計實現(xiàn)簡單,占用
    發(fā)表于 12-20 06:32

    RGB-D圖像是什么

    RGB-D圖像其實是兩幅圖像。
    的頭像 發(fā)表于 11-01 11:46 ?1.9w次閱讀

    一種適用于動態(tài)場景的SLAM方法

    同時定位與地圖構建(SLAM)作為機器人領域的硏究熱點,近年來取得了快速發(fā)展,但多數(shù)SLAM方法未考慮應用場景中的動態(tài)或可移動目標。針對該問題,提出一種
    發(fā)表于 03-18 10:39 ?21次下載
    <b class='flag-5'>一種</b><b class='flag-5'>適用于</b><b class='flag-5'>動態(tài)</b>場景的<b class='flag-5'>SLAM</b>方法

    用于SLAM的神經(jīng)隱含可擴展編碼

    我們提出了NICE-SLAM個密集的RGB-D SLAM系統(tǒng),它具有實時性、可擴展性、預測性
    的頭像 發(fā)表于 01-30 11:19 ?998次閱讀

    用于快速高保真RGB-D表面重建的神經(jīng)特征網(wǎng)格優(yōu)化的GO-Surf

    我們提出了GO-Surf,一種直接的特征網(wǎng)格優(yōu)化方法,用于RGB-D序列中準確和快速地重建表面。
    的頭像 發(fā)表于 03-17 16:35 ?1006次閱讀

    用于神經(jīng)場SLAM的矢量化對象建圖

    vMAP 是一種基于神經(jīng)場的對象級密集 SLAM 系統(tǒng),可根據(jù) RGB-D 輸入流實時自動構建對象級場景模型。
    的頭像 發(fā)表于 06-15 09:29 ?1126次閱讀
    <b class='flag-5'>用于</b>神經(jīng)場<b class='flag-5'>SLAM</b>的矢量化對象建圖

    動態(tài)環(huán)境下的實時語義RGB-D SLAM系統(tǒng)

    大多數(shù)現(xiàn)有的視覺SLAM方法嚴重依賴于靜態(tài)世界假設,在動態(tài)環(huán)境中很容易失效。本文提出了動態(tài)環(huán)境
    的頭像 發(fā)表于 08-25 16:49 ?1060次閱讀
    <b class='flag-5'>一</b>個<b class='flag-5'>動態(tài)</b><b class='flag-5'>環(huán)境</b>下的<b class='flag-5'>實時</b>語義<b class='flag-5'>RGB-D</b> <b class='flag-5'>SLAM</b><b class='flag-5'>系統(tǒng)</b>

    一種適用于動態(tài)場景的多層次地圖構建算法

    本文提出了一種適用于動態(tài)場景的多層次地圖構建算法,如圖1所示的系統(tǒng)框架。首先,利用YOLOX[8]獲取場景的語義信息,采用多目標跟蹤算法對漏檢進行補償,利用DBSCAN密度聚類算法和深
    發(fā)表于 08-28 10:56 ?1035次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>適用于</b><b class='flag-5'>動態(tài)</b>場景的多層次地圖構建算法

    一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng)

    提出了一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng),該系統(tǒng)由完整的前端和后端模塊組成,包括里程計、回環(huán)檢測、子圖融
    的頭像 發(fā)表于 11-29 10:35 ?938次閱讀
    <b class='flag-5'>一種</b>基于<b class='flag-5'>RGB-D</b>圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(<b class='flag-5'>SLAM</b>)<b class='flag-5'>系統(tǒng)</b>

    常用的RGB-D SLAM解決方案

    BundleFusion是一種稠密的實時室內(nèi)場景三維重建算法框架。輸入為RGB-D相機采集的并且是對齊好的RGB圖像和深度圖的數(shù)據(jù)流。輸出為重建好的稠密三維場景模型。
    的頭像 發(fā)表于 04-16 09:37 ?1550次閱讀
    常用的<b class='flag-5'>RGB-D</b> <b class='flag-5'>SLAM</b>解決方案

    一種適用于動態(tài)環(huán)境實時視覺SLAM系統(tǒng)

    既能保證效率和精度,又無需GPU,行業(yè)第個達到此目標的視覺動態(tài)SLAM系統(tǒng)。
    的頭像 發(fā)表于 09-30 14:35 ?1320次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>適用于</b><b class='flag-5'>動態(tài)</b><b class='flag-5'>環(huán)境</b>的<b class='flag-5'>實時</b>視覺<b class='flag-5'>SLAM</b><b class='flag-5'>系統(tǒng)</b>

    一種適用于動態(tài)環(huán)境的3DGS-SLAM系統(tǒng)

    當前基于神經(jīng)輻射場(NeRF)或3D高斯?jié)姙R(3DGS)的SLAM方法在重建靜態(tài)3D場景方面表現(xiàn)出色,但在動態(tài)環(huán)境中的跟蹤和重建方面卻面臨著
    的頭像 發(fā)表于 06-13 10:10 ?274次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>適用于</b><b class='flag-5'>動態(tài)</b><b class='flag-5'>環(huán)境</b>的3DGS-<b class='flag-5'>SLAM</b><b class='flag-5'>系統(tǒng)</b>