最近在做基于激光信息的機(jī)器人行人跟蹤發(fā)現(xiàn)如果單獨(dú)利用激光信息很難完成機(jī)器人對(duì)行人的識(shí)別、跟蹤等功能,因此考慮與視覺(jué)融合的方法,這樣便可以充分利用激光雷達(dá)提供的精確位置信息及視覺(jué)提供的豐富紋理、顏色等場(chǎng)景信息。以下是最近調(diào)研視覺(jué)SLAM中的實(shí)現(xiàn)方法的總結(jié),包括三方面內(nèi)容:姿態(tài)計(jì)算、閉環(huán)檢測(cè)、BA優(yōu)化。
姿態(tài)計(jì)算
一、通過(guò)提取圖像的特征描述子,如ORB、SURF和SIFT等特征描述子,然后通過(guò)RANSAC算法進(jìn)行圖像匹配去除匹配點(diǎn)中的外點(diǎn),再通過(guò)將二維點(diǎn)對(duì)映射到三維之后,便可以利用PnP或ICP算法計(jì)算相機(jī)位姿。基于特征提取的位姿計(jì)算算法對(duì)場(chǎng)景有一定的要求,在無(wú)紋理場(chǎng)景會(huì)出現(xiàn)位姿計(jì)算失敗的情形。
二、直接圖像匹配方法:直接圖像匹配并不對(duì)圖片進(jìn)行特征提取,核心思想是在旋轉(zhuǎn)坐標(biāo)系下,基于相機(jī)一致性的假設(shè),在相機(jī)的剛體變換已知的情況下,利用相機(jī)變換矩陣將目標(biāo)圖片投影到當(dāng)前圖片上,其像素之間的差異應(yīng)該最小,將姿態(tài)計(jì)算轉(zhuǎn)換為加權(quán)最小二乘問(wèn)題。直接圖像匹配算法的計(jì)算效率很高,不依賴GPU,具有很高的理論和商用價(jià)值。
閉環(huán)檢測(cè)
閉環(huán)檢測(cè)算法指的是通過(guò)檢測(cè)算法檢測(cè)出之前訪問(wèn)過(guò)的場(chǎng)景。如圖1所示,當(dāng)機(jī)器人在移動(dòng)過(guò)程中,特別是在探索大面積的場(chǎng)景時(shí),由于模型的不確定性以及設(shè)備的噪聲,不確定性會(huì)逐漸增長(zhǎng)。通過(guò)引入閉環(huán)檢測(cè)技術(shù),識(shí)別出歷史訪問(wèn)過(guò)的場(chǎng)景以增加位姿之間的約束,可以很好的減少這種不確定性。
閉環(huán)檢測(cè)前后對(duì)比(a) 累計(jì)誤差導(dǎo)致的構(gòu)圖錯(cuò)誤,(b)閉環(huán)約束后的地圖
閉環(huán)檢測(cè)方法有:
一、最簡(jiǎn)單的閉環(huán)檢測(cè)算法是將新檢測(cè)出來(lái)的關(guān)鍵幀和過(guò)去所有的關(guān)鍵幀一一進(jìn)行比較,雖然這種方法能比較好的檢測(cè)出當(dāng)前場(chǎng)景是否在之前出現(xiàn)過(guò),但是在大規(guī)模場(chǎng)景下,機(jī)器人往往有成千上萬(wàn)個(gè)關(guān)鍵幀,這種方法檢測(cè)效率及其底下,不能再實(shí)際場(chǎng)景中使用。
二、通過(guò)將圖像中的特征和整個(gè)地圖中的路標(biāo)對(duì)應(yīng)起來(lái),然后建立一個(gè)所有路標(biāo)的數(shù)據(jù)庫(kù),通過(guò)使用路標(biāo)分類器來(lái)加快場(chǎng)景識(shí)別速度。比如講所有路標(biāo)構(gòu)建成一棵KD-Tree,當(dāng)新添加一幀關(guān)鍵幀時(shí),將關(guān)鍵幀在KD-Tree中進(jìn)行檢索,從中檢索之前出現(xiàn)過(guò)的場(chǎng)景。
三、基于視覺(jué)詞袋的閉環(huán)檢測(cè)方法,這種方法通過(guò)將特征描述子抽象成詞匯,通過(guò)TF-IDF方法識(shí)別出現(xiàn)過(guò)的場(chǎng)景。如圖2所示,是閉環(huán)檢測(cè)中基于詞袋模型流程圖。使用視覺(jué)詞袋的方法效率很高,可用在大規(guī)模地圖的創(chuàng)建上。
BA優(yōu)化
一、問(wèn)題闡述:同時(shí)對(duì)三維點(diǎn)位置和相機(jī)參數(shù)進(jìn)行非線性優(yōu)化。
BA原理
二、LM法的原理與優(yōu)勢(shì):
原理:是一種“信賴域”的方法,當(dāng)收斂速度較快時(shí),增大信賴域使算法趨向于高斯牛頓法;當(dāng)收斂速度較慢時(shí),減小信賴域使算法趨向于最速下降法。優(yōu)勢(shì):速度快;可以在距離初始值較遠(yuǎn)處得到最優(yōu)解。
SLAM優(yōu)化算法對(duì)比
算法 | 缺點(diǎn) | 優(yōu)點(diǎn) |
---|---|---|
KF/EKF | 假設(shè)噪聲為高斯分布,在高維狀態(tài)空間時(shí)計(jì)算效率較低,不適合大規(guī)模場(chǎng)景的地圖構(gòu)建 | 原理簡(jiǎn)單,小場(chǎng)景下收斂性好。 |
PF | 會(huì)不可避免出現(xiàn)粒子退化現(xiàn)象,每個(gè)粒子需包含整張地圖信息導(dǎo)致不適合大場(chǎng)景地圖構(gòu)建 | 將運(yùn)動(dòng)方程表示為一組粒子,通過(guò)蒙特卡羅方法求解,能夠處理非線性非高斯噪聲。 |
EM | 計(jì)算量大,不能用于大規(guī)模場(chǎng)景 | 有效解決了數(shù)據(jù)關(guān)聯(lián)問(wèn)題 |
圖優(yōu)化 | 對(duì)閉環(huán)檢測(cè)算法的要求嚴(yán)格 | 出現(xiàn)多種圖優(yōu)化框架,能夠有效解決濾波器算法的缺陷,能用于大規(guī)模場(chǎng)景的地圖創(chuàng)建 |
-
機(jī)器視覺(jué)
+關(guān)注
關(guān)注
163文章
4596瀏覽量
122891 -
激光雷達(dá)
+關(guān)注
關(guān)注
971文章
4235瀏覽量
192849
原文標(biāo)題:視覺(jué)SLAM關(guān)鍵方法總結(jié)
文章出處:【微信號(hào):IV_Technology,微信公眾號(hào):智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
一種適用于動(dòng)態(tài)環(huán)境的實(shí)時(shí)RGB-D SLAM系統(tǒng)

三維高斯?jié)姙R大規(guī)模視覺(jué)SLAM系統(tǒng)解析

【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】視覺(jué)實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用
【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】+ROS2應(yīng)用案例
一種基于點(diǎn)、線和消失點(diǎn)特征的單目SLAM系統(tǒng)設(shè)計(jì)

一種基于MASt3R的實(shí)時(shí)稠密SLAM系統(tǒng)
用于任意排列多相機(jī)的通用視覺(jué)里程計(jì)系統(tǒng)

利用VLM和MLLMs實(shí)現(xiàn)SLAM語(yǔ)義增強(qiáng)


探索 SLAM 技術(shù)賦能的 MR 混合現(xiàn)實(shí)應(yīng)用場(chǎng)景 #可視化 #MR #混合現(xiàn)實(shí) #SLAM
激光雷達(dá)在SLAM算法中的應(yīng)用綜述

MG-SLAM:融合結(jié)構(gòu)化線特征優(yōu)化高斯SLAM算法

機(jī)器視覺(jué)要面臨的挑戰(zhàn)及其解決方法
從算法角度看 SLAM(第 2 部分)

一種適用于動(dòng)態(tài)環(huán)境的實(shí)時(shí)視覺(jué)SLAM系統(tǒng)

評(píng)論