一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺談?wù)Z義在SLAM中的應(yīng)用

新機器視覺 ? 來源:濤濤CV ? 作者:濤濤CV ? 2021-06-15 13:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Simultaneous Localization And Mapping(同時建圖與定位)

可以分為四大部分:initialization, tracking, local mapping, global optimization

視覺SLAM主要涉及的知識

多視角幾何:投影幾何,相機模型

圖像處理:特征提取,特征點跟蹤

優(yōu)化算法:非線性優(yōu)化算法(Levenberg-Marquardt法)

INITIALIZATION

一般將第一張圖像進入系統(tǒng)時的相機位姿作為V-SLAM系統(tǒng)的參考坐標(biāo)系

選取之后輸入的某張圖像計算和第一張圖像匹配角點并三角化獲取深度,生成候選的初始化MAP

重投影計算誤差,如果誤差太大則重新選取圖像

直到誤差小于閾值,進行一次優(yōu)化,得到初始化MAP

TRACKING

計算當(dāng)前圖像和之前相近圖像的關(guān)系(特征點匹配,光流法,邊緣跟蹤等等)

根據(jù)計算出的關(guān)系,通過相應(yīng)算法估計當(dāng)前相機的大概位置

其中“直接法”將前面兩部合并為一步來執(zhí)行

LOCAL MAPPING

可以采取滑動窗口的方式或者挑選某些關(guān)鍵幀來建立局部地圖

當(dāng)某一幀圖像根據(jù)策略算法選為關(guān)鍵幀后,添加到局部地圖的關(guān)鍵幀隊列中

管理局部地圖中存在的點云

進行局部的Bundle Adjustment(BA)

最后進行關(guān)鍵幀的管理

GLOBAL OPTIMIZATION

利用BOW挑選出候選回環(huán)幀

對候選回環(huán)幀進行驗證,確保是正確的回環(huán)

根據(jù)回環(huán)幀計算累積漂移誤差

最后進行全局優(yōu)化

語義SLAM

為什么要語義?

對環(huán)境的魯棒性(動態(tài)環(huán)境)

獲取地圖的先驗信息,得到更高精度(添加語義約束)

更好地回環(huán)檢測

人機交互(如CAD制圖)

poYBAGDIOiuADxblAAE1k4-MlT0144.jpg

傳統(tǒng)回環(huán)檢測

目前比較主流的回環(huán)檢測方法一般都依賴于BoW(bag of visual words)方法

開源庫:DBoW2: https://github.com/dorian3d/DBoW2(當(dāng)然還有DBoW3,fbow)

連續(xù)幀匹配DLoopDetector:https://github.com/dorian3d/DLoopDetector

ORB-SLAM,VINS等都使用了DBoW2

其他檢索方式還有LSH(Locality-Sensitive Hashing)以及

LLC(Locality-constrained Linear Coding)

語義能夠給SLAM系統(tǒng)帶來的好處

支持中長期的tracking

環(huán)境適應(yīng)性更強(魯棒性)

潛在的人機交互特性

語義SLAM系統(tǒng)和傳統(tǒng)SLAM系統(tǒng)對比

pYYBAGDIOiSAXcocAAC_etSKNcA215.jpg

由于我們 人類見過大量的圖像,形成了一種天生的直覺,對大部分場景都有一個直觀的距離感 (空間感),它可以幫助我們判斷圖像中物體的遠近關(guān)系。

1.平移之后才能計算深度

2.無法確定真實尺度

原因是通過單張圖像無法確定深度。

深度相機(稱RGB-D相機)最大的特點是可以通過紅外結(jié)構(gòu)光或Time-of-Flight(ToF) 原理,像激光傳感器那樣,通過主動向物體發(fā)射光并接收返回的光,測出物體與相機之間的距離。這部分是通過物理的測量手段來解決的,所以不需要大量的算力。

ToF

基本原理是通過連續(xù)發(fā)射光脈沖(一般為不可見光)到被觀測物體上,然后用傳感器接收從物體返回的光,通過探測光脈沖的飛行(往返)時間來得到目標(biāo)物距離。

pYYBAGDIOh2AVTlIAABI93r9pxY207.jpg

結(jié)構(gòu)光

結(jié)構(gòu)光測距是用一個光源(常用是紅外)將一定的圖案投射到物體上,再用攝像頭收集變形后的圖案進行深度計算。

poYBAGDIOhaAaLXPAABQnZsNWSc032.jpg

這種方法比純雙目匹配好的地方在于,參考圖像不是獲取的,而是經(jīng)過專門設(shè)計的圖案 ,因此特征點是已知的,而且更容易從測試圖像中提取。結(jié)構(gòu)光采用三角視差測距,基線(光源與鏡頭光心的距離)越長精度越高。由于是主動光,無法在室外使用。

不論是一般結(jié)構(gòu)光還是散斑結(jié)構(gòu)光,缺點是它所使用的激光器發(fā)出的編碼光斑容易被太陽光淹沒掉, 工作距離短,室外陽光下不工作。

結(jié)構(gòu)光方案中的激光器壽命較短,難以滿足7x24小時的長時間工作要求,其長時間連續(xù)工作很容易損壞。而因為單目鏡頭和激光器需要進行精確的標(biāo)定,一旦損壞,替換激光器時重新進行兩者的標(biāo)定是非常困難的,所以往往導(dǎo)致整個模塊都要一起被換掉。

現(xiàn)在多數(shù) RGB-D 相機還存在測量范圍窄、噪聲大、視野小、易受日光干擾、無法測量透射材質(zhì)等諸多問題,在 SLAM 方面,主要用于室內(nèi),室外則較難應(yīng)用。

立體視覺

pYYBAGDIOg6AKaWtAACYEf1BI2Y459.jpg

雙目相機 的距離估計是比較左右眼的圖像獲得的,并不依賴其他傳感設(shè)備,所以它既可以應(yīng)用在室內(nèi),亦可應(yīng)用于室外。

雙目立體視覺是純視覺的方法,需要逐像素計算匹配;同時,為了保證匹配結(jié)果比較魯棒,算法中會增加大量的錯誤剔除策略,因此對算法要求較高,計算量較大。

VSLAM(Mono)

優(yōu)勢:成本低、搭建簡單

劣勢:

1) 需要專門初始化

2) 尺度問題

在單張圖片里,無法確定一個物體的真實大小。它可能是一個很大但很遠的物體,也可能是一個很近很小的物體。

3) 深度計算存在缺陷

a. 3D假圖問題

b. 機器學(xué)習(xí)的樣本問題

VSLAM(Stereo)

優(yōu)勢:

1) 不需要專門初始化

2) 能夠計算深度

3) 能夠用于室內(nèi)和室外

劣勢:

1) 標(biāo)定較為復(fù)雜

2) 視差計算比較耗資源,需要GPU/FPGA 或 專門的ASIC芯片 協(xié)助。

責(zé)任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SLAM
    +關(guān)注

    關(guān)注

    24

    文章

    441

    瀏覽量

    32496

原文標(biāo)題:語義SLAM與深度相機

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于深度學(xué)習(xí)的增強版ORB-SLAM3詳解

    ORB-SLAM3雖是當(dāng)前最先進的SLAM之一,但由于使用傳統(tǒng)的ORB(定向FAST和旋轉(zhuǎn)BRIEF)特征,尺度、旋轉(zhuǎn)和光照發(fā)生顯著變化時可能會表現(xiàn)出局限性。
    的頭像 發(fā)表于 07-14 17:21 ?182次閱讀
    基于深度學(xué)習(xí)的增強版ORB-<b class='flag-5'>SLAM</b>3詳解

    一種適用于動態(tài)環(huán)境的實時RGB-D SLAM系統(tǒng)

    近期用于視覺SLAM的3D高斯?jié)姙R(3DGS)技術(shù)在跟蹤和高保真建圖方面取得了顯著進展。然而,其順序優(yōu)化框架以及對動態(tài)物體的敏感性限制了其現(xiàn)實場景的實時性能和魯棒性。為此,我們提出
    的頭像 發(fā)表于 07-04 15:14 ?202次閱讀
    一種適用于動態(tài)環(huán)境的實時RGB-D <b class='flag-5'>SLAM</b>系統(tǒng)

    三維高斯?jié)姙R大規(guī)模視覺SLAM系統(tǒng)解析

    近期興起的神經(jīng)輻射場(NeRF)與三維高斯?jié)姙R(3DGS)技術(shù)視覺SLAM展現(xiàn)出令人鼓舞的突破性成果。然而,當(dāng)前主流方法多依賴RGBD傳感器,并且僅適用于室內(nèi)環(huán)境。大規(guī)模室外場景
    的頭像 發(fā)表于 05-27 14:13 ?314次閱讀
    三維高斯?jié)姙R大規(guī)模視覺<b class='flag-5'>SLAM</b>系統(tǒng)解析

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎(chǔ)算法的應(yīng)用

    ,還能理解環(huán)境的物體語義(如識別門、桌椅等)。 工程化挑戰(zhàn) 書中案例表明,理論算法與工程落地之間存在差距。例如,深度學(xué)習(xí)模型的實時性、SLAM動態(tài)環(huán)境
    發(fā)表于 05-03 19:41

    一種基于點、線和消失點特征的單目SLAM系統(tǒng)設(shè)計

    本文提出了一種穩(wěn)健的單目視覺SLAM系統(tǒng),該系統(tǒng)同時利用點、線和消失點特征來進行精確的相機位姿估計和地圖構(gòu)建,有效解決了傳統(tǒng)基于點特征的SLAM的局限性。
    的頭像 發(fā)表于 03-21 17:07 ?458次閱讀
    一種基于點、線和消失點特征的單目<b class='flag-5'>SLAM</b>系統(tǒng)設(shè)計

    淺談直流有刷電機驅(qū)動及調(diào)速技術(shù)

    基于直流有刷電機的基本工作原理,可將 該電機的驅(qū)動裝置視作一個控制電路的開關(guān), 所有具備開關(guān)特征的電子元件都可用以此種電 機的驅(qū)動 [2] 。直流無刷電機驅(qū)動,最典型 的驅(qū)動電路為 H 橋電路
    發(fā)表于 03-07 15:24

    SparseViT:以非語義為中心、參數(shù)高效的稀疏化視覺Transformer

    (IML)都遵循“語義分割主干網(wǎng)絡(luò)”與“精心制作的手工制作非語義特征提取”相結(jié)合的設(shè)計,這種方法嚴(yán)重限制了模型未知場景的偽影提取能力。 論文標(biāo)題: Can We Get Rid
    的頭像 發(fā)表于 01-15 09:30 ?458次閱讀
    SparseViT:以非<b class='flag-5'>語義</b>為中心、參數(shù)高效的稀疏化視覺Transformer

    利用VLM和MLLMs實現(xiàn)SLAM語義增強

    語義同步定位與建圖(SLAM)系統(tǒng)在對鄰近的語義相似物體進行建圖時面臨困境,特別是復(fù)雜的室內(nèi)環(huán)境。本文提出了一種面向?qū)ο?/div>
    的頭像 發(fā)表于 12-05 10:00 ?1365次閱讀
    利用VLM和MLLMs實現(xiàn)<b class='flag-5'>SLAM</b><b class='flag-5'>語義</b>增強

    最新圖優(yōu)化框架,全面提升SLAM定位精度

    同時定位與地圖構(gòu)建(SLAM)是一項關(guān)鍵技術(shù),允許移動機器人在部分或完全未知的環(huán)境自主導(dǎo)航。它包括使用機載傳感器同時估計機器人狀態(tài)和構(gòu)建傳感器檢測到的環(huán)境地圖。SLAM可以根據(jù)傳感器和地圖構(gòu)建技術(shù)
    的頭像 發(fā)表于 11-12 11:26 ?1235次閱讀
    最新圖優(yōu)化框架,全面提升<b class='flag-5'>SLAM</b>定位精度

    如何設(shè)定機器人語義地圖的細粒度級別

    0. 這篇文章干了啥? 機器人學(xué)的一個基本問題是創(chuàng)建機器人觀察到的場景的有用地圖表示,其中有用性由機器人利用地圖完成感興趣的任務(wù)的能力來衡量。最近的研究,包括構(gòu)建語義度量三維地圖,通過檢測對象
    的頭像 發(fā)表于 11-12 10:54 ?674次閱讀
    如何設(shè)定機器人<b class='flag-5'>語義</b>地圖的細粒度級別

    激光雷達SLAM算法的應(yīng)用綜述

    一、文章概述 1.1 摘 要 即時定位與地圖構(gòu)建(simultaneous localization and mapping,SLAM)是自主移動機器人和自動駕駛的關(guān)鍵 技術(shù)之一,而激光雷達則是支撐
    的頭像 發(fā)表于 11-12 10:30 ?2525次閱讀
    激光雷達<b class='flag-5'>在</b><b class='flag-5'>SLAM</b>算法<b class='flag-5'>中</b>的應(yīng)用綜述

    MG-SLAM:融合結(jié)構(gòu)化線特征優(yōu)化高斯SLAM算法

    同步定位與地圖構(gòu)建 (SLAM) 是計算機視覺的一個基本問題,旨在在同時跟蹤相機姿勢的同時對環(huán)境進行地圖構(gòu)建?;趯W(xué)習(xí)的密集 SLAM 方法,尤其是神經(jīng)輻射場 (NeRF) 方法,
    的頭像 發(fā)表于 11-11 16:17 ?874次閱讀
    MG-<b class='flag-5'>SLAM</b>:融合結(jié)構(gòu)化線特征優(yōu)化高斯<b class='flag-5'>SLAM</b>算法

    從算法角度看 SLAM(第 2 部分)

    作者: Aswin S Babu 正如我們[第 1 部分]中所討論的,SLAM 是指在無地圖區(qū)域中估計機器人車輛的位置,同時逐步繪制該區(qū)域地圖的過程。根據(jù)使用的主要技術(shù),SLAM 算法可分為三種
    的頭像 發(fā)表于 10-02 16:39 ?789次閱讀
    從算法角度看 <b class='flag-5'>SLAM</b>(第 2 部分)

    圖像語義分割的實用性是什么

    圖像語義分割是一種重要的計算機視覺任務(wù),它旨在將圖像的每個像素分配到相應(yīng)的語義類別。這項技術(shù)許多領(lǐng)域都有廣泛的應(yīng)用,如自動駕駛、醫(yī)學(xué)圖
    的頭像 發(fā)表于 07-17 09:56 ?912次閱讀