針對在時變的室外環(huán)境中難以視覺定位的問題,博士生顏深創(chuàng)新性地提出一種解決方案 SensLoc。SensLoc 利用移動設備內(nèi)置的傳感器數(shù)據(jù),如 GPS、指南針和重力傳感器,為視覺定位提供有效的初始位姿和約束條件,從而縮小圖像檢索和位姿估計的搜索空間。
此外,SensLoc 還設計了一個直接的 2D-3D 匹配網(wǎng)絡,以高效地建立查詢圖像與三維場景之間的對應關系,避免了現(xiàn)有系統(tǒng)中需要多次進行 2D-2D 匹配的低效方案。為了驗證 SensLoc 的有效性,論文還構建了一個新的數(shù)據(jù)集,該數(shù)據(jù)集包含了多種移動傳感器數(shù)據(jù)和顯著的場景外觀變化,并開發(fā)了一個系統(tǒng)來獲取查詢圖像的真實位姿。大量的實驗表明 SensLoc 可以在時變的室外環(huán)境中實現(xiàn)準確、魯棒且高效的視覺定位。
,圖像檢索任務需要在參考圖像集
里找到與查詢圖有共視關系的圖像子集:
,其位置分量來源于 GPS,旋轉分量來自于重力計和指南針方向的集成。查詢圖像只需要在圖像子集
中檢索共視鄰居
?
表示經(jīng)緯度的 x-y 坐標,
表示相機的主軸方向。
2 直接的 2D-3D 匹配
給定查詢圖
和共視鄰居
,2D-3D 匹配任務需要建立
像素點與
能觀察到的局部點云
之間的 2D-3D 對應關系。
具體而言,首先使用多層級網(wǎng)絡提取查詢圖
?和參考圖
的粗(用
表示)、細(用
表示)粒度特征,然后將局部點云
投影在參考特征圖上并進行插值、平均,得到點云特征。
然后,使用帶注意力機制的網(wǎng)絡匹配查詢圖與局部點云的粗粒度特征,確定點云是否為查詢圖像所見,并初步確定它在圖像上的位置。使用注意力機制變換后的粗粒度圖像和點云特征分別為
,概率匹配矩陣
表示為
表示為
,通過將點云的細粒度特征
與在
附近裁剪出細粒度窗口特征
進行點乘,得到匹配概率并計算二維位置期望,獲取查詢圖像的亞像素
與局部點云
的精確對應關系。
3 基于重力方向的 PnP RANSAC
給定 2D-3D 的對應關系,之前的工作通常采用 PnP RANSAC 算法求解相機的六自由度位姿。論文在 PnP RANSAC 迭代中插入一個簡單有效的驗證模塊,以保證重力方向的正確性。具體地,對于 RANSAC 迭代生成的位姿假設
,其與傳感器位姿
在重力方向
上差值為
預先過濾掉大部分錯誤位姿,實現(xiàn)更高效、魯棒的位姿解算。
數(shù)據(jù)集
論文構建了一個新的數(shù)據(jù)集,用于驗證所提方法的有效性。該數(shù)據(jù)集包括一個城市公園(約 31,250 平方米),包含植被、河流、建筑和人行道。作為一個公共區(qū)域,其不可避免地會經(jīng)歷各種場景的變化,例如不同光照、季節(jié)、天氣,運動的行人、車輛,甚至新的基礎設施建設。數(shù)據(jù)集的構建流程如下圖所示。
。相較于單目相機,全景相機具有更高的采集效率。將 7,958 張全景圖像切分并轉換為針孔模型后,該數(shù)據(jù)集包括 47,780 張參考圖像。為了確定模型尺度并與地理坐標系保持一致,該研究預先在全景相機上綁定了一個 RTK 記錄儀,以記錄絕對地理坐標。
2 查詢圖像采集
在三維參考地圖構建完成半年后,該研究在相同地址中行走,并開發(fā)了一款安卓應用程序 Acquisition Application(采集 APP),使用華為 P40 pro 和小米 Mix 3 手機拍攝視頻以采集查詢圖像,并通過綁定 RTK 記錄儀獲取拍攝時的地理位置信息。該采集 APP 能夠同時記錄手機內(nèi)置傳感器的數(shù)據(jù),包括 IMU、重力計、指南針、藍牙、WiFi 和 GPS。拍攝視頻與所有傳感器均經(jīng)過硬件同步和細致校準。由于論文關注于單圖的視覺定位,因此視頻序列會進行采樣以生成不連續(xù)的單張圖像。
3 三維輔助地圖構建與偽位姿真值生成
由于查詢圖像與三維參考地圖之間存在跨時節(jié)的變化,因此基于半年前構建的三維參考地圖生成查詢圖像的偽位姿真值較為困難。論文提出在采集查詢圖像時,同時構建一個三維輔助地圖
。三維輔助地圖的構建方法與三維參考地圖類似,同樣使用全景相機和 RTK 記錄儀進行采集,并采用 ICP 技術進行對齊。基于三維輔助地圖生成查詢圖像的偽真值等同于基于三維參考地圖生成的偽真值。論文設計了一套聯(lián)合優(yōu)化方法生成偽真值,優(yōu)化項包括:1)圖像自定位約束;2)序列圖像的相對位姿約束;3)IMU 的運動約束;4)其他先驗約束,如重力方向和 RTK 位置。




















為互最近鄰,
為預設閾值。
最后,對于每一個粗匹配對應的二維像素和三維點云












審核編輯 :李倩
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
傳感器
+關注
關注
2561文章
52244瀏覽量
762018 -
圖像檢索
+關注
關注
0文章
28瀏覽量
8109 -
視覺定位
+關注
關注
5文章
54瀏覽量
12628
原文標題:CVPR 2023 | 六自由度視覺定位
文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
熱點推薦
DSP在六自由度電磁跟蹤系統(tǒng)中的應用
六自由度電磁跟蹤系統(tǒng)根據(jù)電磁感應的原理來計算出目標的六個自由度參數(shù),從而唯一確定目標的位置和姿態(tài)。怎樣由接收到的模擬信號計算得到目標的位置和姿態(tài)參數(shù)是影響整個系統(tǒng)性能的關鍵所在。在一些
發(fā)表于 01-25 00:11
?1423次閱讀

基于FPGA EtherCAT的六自由度機器人視覺伺服控制設計
和增強系統(tǒng)處理圖像的實時性,本文提出了一種伊瑟特的六自由度機器人視覺伺服控制系統(tǒng),將攝像頭集成到基于 Zynq的伊瑟特主站上,提高了視覺伺服的實時性.經(jīng)測試,該平臺能夠對
發(fā)表于 05-29 16:17
基于STM32、以太網(wǎng)、Labview的六自由度Stewart并聯(lián)運動平臺模型
六自由度Stewart并聯(lián)運動平臺模型-X,Y,Z平移、旋轉測試六自由度Stewart并聯(lián)運動平臺-Z向旋轉正弦波復現(xiàn)六
發(fā)表于 04-16 23:25
基于Matlab的開源六自由度協(xié)作機器人實驗平臺
一前言針對機器人相關專業(yè)的教學需求,商飛信息科技開發(fā)出此開源六自由度協(xié)作機器人實驗平臺。該平臺有以下幾大特色機器人本體采用自主設計的3Kg負載六自由度協(xié)作機器人,機器人每個關節(jié)集成電機
發(fā)表于 09-07 07:10
什么是六自由度壓電納米定位臺,它的作用是什么
什么是六自由度壓電納米定位臺? 六自由度壓電納米定位臺可產(chǎn)生X、Y、Z三軸直線運動以及x、y、z
發(fā)表于 08-10 11:37
?1380次閱讀
ADIS16485:戰(zhàn)術級六自由度慣性傳感器數(shù)據(jù)表
ADIS16485:戰(zhàn)術級六自由度慣性傳感器數(shù)據(jù)表
發(fā)表于 05-23 17:32
?9次下載

ADIS16495:戰(zhàn)術級六自由度慣性傳感器數(shù)據(jù)表
ADIS16495:戰(zhàn)術級六自由度慣性傳感器數(shù)據(jù)表
發(fā)表于 05-25 18:04
?9次下載

ADIS16497:戰(zhàn)術級六自由度慣性傳感器數(shù)據(jù)表
ADIS16497:戰(zhàn)術級六自由度慣性傳感器數(shù)據(jù)表
發(fā)表于 05-25 20:07
?7次下載

基于FPGA的六自由度機器人視覺伺服控制方案設計
? 機器人視覺系統(tǒng)的硬件選擇直接影響圖像采集,圖像的質(zhì)量和后期的處理,并影響整個控制系統(tǒng)的實時性,所以應根據(jù)要求和這些硬件性能,嚴格選擇硬件。基于伊瑟特的六自由度機器人視覺伺服控制系統(tǒng)
發(fā)表于 04-24 10:31
?741次閱讀

評論