一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

通過場景l(fā)andmark做定位的新思路(CVPR 2022)

3D視覺工坊 ? 來源:3D視覺工坊 ? 作者:3D視覺工坊 ? 2022-12-16 11:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

主要內(nèi)容:提出了一種基于學習的相機定位算法,其無需存儲圖像特征和場景三維點云,降低了存儲限制,通過識別場景中稀疏但顯著有代表性的landmark來找到2D-3D對應關(guān)系進行后續(xù)的魯棒姿態(tài)估計,通過訓練檢測landmark的場景特定的CNN來實現(xiàn)所提出的想法,即回歸輸入圖像中對應landmark的2D坐標。

634694fc-7ce5-11ed-8abf-dac502259ad0.png

創(chuàng)新點與Contributions:1)與大多數(shù)landmark通??梢姷娜梭w姿態(tài)估計不同,由于相機視野有限并且無法同時觀察場景的不同部分,相機姿態(tài)估計任務中大多數(shù)場景l(fā)andmark不會同時可見,文章通過提出一種新的神經(jīng)方位估計器(Neural Bearing Estimator,NBE)來解決這一問題,該估計器可以直接回歸相機坐標系中場景l(fā)andmark的3D方位向量,NBE學習全局場景表示的同時學習預測場景l(fā)andmark的方向向量,即使它們不可見。 2)提出了一個新的室內(nèi)定位數(shù)據(jù)集,INDOOR-6,相對于傳統(tǒng)的7-Scenes室內(nèi)數(shù)據(jù)集,包含更多變化的場景、晝夜圖像和強烈的照明變化 3)與現(xiàn)有的無存儲定位方法相比,具有低存儲的優(yōu)點且性能較好 文章提出了兩種預測圖像中場景l(fā)andmark的方法,在第一種方法中訓練了一個模型來識別圖像中的2D場景地標,稱之為場景地標檢測器(SLD),由于假設已知的相機內(nèi)參,這些2D檢測可以轉(zhuǎn)換為3D方位矢量或射線。在第二種方法中訓練了一個不同的模型直接預測相機坐標系中l(wèi)andmark的3D方位向量,稱之為神經(jīng)方位估計器(NBE)。注:使用SLD,只能檢測到相機視場(FoV)中可見的landmark,而NBE預測所有l(wèi)andmark的方位,包括相機視場外不可見的landmark。

63d732a0-7ce5-11ed-8abf-dac502259ad0.png

首先會有一個SFM構(gòu)建的點云模型,會在這些點云中挑選出有代表性的點云子集,用這些子集以及建圖時SFM算法生成的數(shù)據(jù)庫圖像的偽真值來訓練兩個提出的網(wǎng)絡模型。SLD:SLD被設計為將RGB圖像I作為輸入并輸出一組像素似然圖(熱圖)表示每個可見地標的位置,其模型架構(gòu)如下:

68351844-7ce5-11ed-8abf-dac502259ad0.png

由四個主要組件組成:使用ResNet-18為backbone,刪除最后三個最大池化層以保留高分辨率特征圖(輸出分辨率為輸入圖像分辨率的四分之一),其次在ResNet-18之后使用擴張卷積塊,擴張率設置為1、2、3和4,接下來轉(zhuǎn)置卷積層執(zhí)行上采樣,并負責生成分辨率為輸入圖像一半的熱圖,最后一層由1×1卷積組成,預測L個熱圖通道,每個地標一個。 訓練損失:

684cdd6c-7ce5-11ed-8abf-dac502259ad0.png

在推斷過程中,假設當其最大熱圖值超過閾值τ=0.2時表明檢測到地標,利用亞像素精度計算熱圖峰值位置處裁剪的17×17 patch的期望值。NBE:設計了一個模型在給定圖像I的情況下回歸全部場景l(fā)andmark(即使它不可見)的方位向量。 CNN將圖像I作為輸入以生成深度特征圖,然后是多個MLP(多層感知器)塊,每個塊輸出指向landmark的方向向量,MLP包含兩個全連接層,具有128個ReLU激活節(jié)點。

686f7782-7ce5-11ed-8abf-dac502259ad0.png

6899dd88-7ce5-11ed-8abf-dac502259ad0.png

訓練好兩個模型后,將每個查詢圖像輸入SLD網(wǎng)絡以獲得2D檢測,然后根據(jù)內(nèi)參將其轉(zhuǎn)換為一組landmark方位向量B1,如果檢測到超過八個場景l(fā)andmark,使用魯棒最小解算器(P3P+RANSAC)計算相機姿態(tài),然后使用基于Levenberg-Marquardt的非線性細化。如果沒有8個,將相同的圖像輸入NBE網(wǎng)絡并獲得預測方位B2,然后合并方位估計B1和B2的集合以形成新的集合B3,當集合B1和B2中的方位指向同一地標時,保留來自B1的估計,因為SLD通常比NBE更準確。最后使用上面描述的相同過程但使用B3計算相機姿態(tài)。如何從點云中選擇有代表性的場景l(fā)andmark提供給網(wǎng)絡進行訓練?從SfM點云P中找到L個場景l(fā)andmark的最佳子集是一個組合問題,其中評估每個子集都是困難的。本文受之前以貪婪的方式尋找有區(qū)別的關(guān)鍵點或場景元素工作的啟發(fā),去選擇魯棒性(具有更長的軌跡)、可重復性(在多個場景中看到)和可概括性(從許多不同的觀看方向和深度觀察)的場景l(fā)andmark,測量軌跡長度大于閾值t的3D點x的顯著性得分A(x),如下所示:

68d42042-7ce5-11ed-8abf-dac502259ad0.png

除了最大化總體顯著性得分之外還尋找在空間上覆蓋3D場景的場景l(fā)andmark以便從場景內(nèi)的任何地方都可以看到一些地標,例如無論攝像機在場景中的哪個位置都希望一些地標可見。為此使用算法1中描述的約束貪婪方法

68e57806-7ce5-11ed-8abf-dac502259ad0.png

下圖表述一些挑選到的landmark在二維圖像中的投影的裁剪patch

68fb4a1e-7ce5-11ed-8abf-dac502259ad0.png

實驗:訓練模型的細節(jié)可去論文中查看 實驗數(shù)據(jù)集是在自己提出的INDOOR-6數(shù)據(jù)集和7Scenes數(shù)據(jù)集上

69223e26-7ce5-11ed-8abf-dac502259ad0.png

評估了單獨使用NBE, SLD,聯(lián)合使用NBE+SLD, NBE+SLD(E)(是更緊湊的網(wǎng)絡),和SOTA的基于分層定位方法結(jié)合HLoc+SLD Baseline為Posenet、DSAC、HLoc 在INDOOR-6數(shù)據(jù)集上的結(jié)果:

697d9d3e-7ce5-11ed-8abf-dac502259ad0.png

69c240b0-7ce5-11ed-8abf-dac502259ad0.png

存儲比較和消融研究:

6a35e38a-7ce5-11ed-8abf-dac502259ad0.png

7Scenes數(shù)據(jù)集上的實驗結(jié)果:

6a53983a-7ce5-11ed-8abf-dac502259ad0.png

總結(jié):算法是一種存儲要求低但精度高的方法。主要見解是在人和物體姿態(tài)估計中廣泛用于關(guān)鍵點檢測的現(xiàn)代CNN架構(gòu)也適用于檢測顯著的、場景特定的3D landmark。 實驗結(jié)果表明,其方法優(yōu)于以前的無存儲方法,但不如HLoc(頂級檢索和匹配方法之一)準確,但是HLoc需要高存儲。而且基于landmark的2D–3D對應關(guān)系補充了HLoc的對應關(guān)系,并且在計算姿態(tài)之前結(jié)合這些對應關(guān)系進一步提高了HLoc精度。局限性:首先神經(jīng)網(wǎng)絡是特定于場景的,像其他學習方法一樣每個場景需要許多訓練圖像,而且在使用之前需要仔細選擇場景l(fā)andmark集。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103572
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4709

    瀏覽量

    95354
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    354

    瀏覽量

    22741

原文標題:通過場景l(fā)andmark做定位的新思路(CVPR 2022)

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    輸電線路分布式故障定位裝置的原理、優(yōu)勢與應用場景解析

    輸電線路分布式故障定位裝置的原理、優(yōu)勢與應用場景解析
    的頭像 發(fā)表于 05-16 09:25 ?211次閱讀

    UWB 定位測距

    指示、可通過撥碼開關(guān)設置參數(shù),包括標簽還是基站的判別,地址的確定等。 應用場景 :室內(nèi)定位、資產(chǎn)追蹤、智能倉儲等。 2、實物照 實物圖片UWB測距定位,UWB3000+Nrf52832
    發(fā)表于 05-12 09:36

    征求 NFER 近場電磁測距 人員定位

    最近遇到一個場景,需要做室內(nèi)人員定位。需要實現(xiàn)基站安裝在電梯上,隨電梯上下移動,定位標簽在人員身上。電梯經(jīng)過時候可以像掃描一樣定位出每層樓的人員位置,對精度沒要求。需要考慮到穿透效果。
    發(fā)表于 03-06 10:15

    時域反射計的技術(shù)原理和應用場景

    一種高效的阻抗測量和分析工具,在多個領域發(fā)揮著重要作用。通過對其反射信號的分析,可以高效地識別并定位阻抗不連續(xù)點,進而提高電路和通信系統(tǒng)的可靠性和性能。
    發(fā)表于 02-11 14:39

    藍牙人員定位技術(shù):場景化應用與優(yōu)勢分析

    在當今智能化、數(shù)字化的時代,藍牙人員定位技術(shù)憑借其低功耗、高精度和易于部署的特點,在眾多場景中發(fā)揮著重要作用。云酷科技將結(jié)合具體場景,探討藍牙人員定位技術(shù)的優(yōu)勢和應用價值。 一、智能制
    的頭像 發(fā)表于 12-31 16:51 ?386次閱讀

    激光錫焊視覺定位技術(shù)的應用場景

    本文主要介紹視覺定位概念、一種基于視覺定位的激光焊接系統(tǒng)的結(jié)構(gòu)和組成,及該焊接系統(tǒng)在某些特定場景的具體應用。
    的頭像 發(fā)表于 12-13 09:10 ?458次閱讀
    激光錫焊視覺<b class='flag-5'>定位</b>技術(shù)的應用<b class='flag-5'>場景</b>

    HarmonyOS NEXT應用元服務開發(fā)控件位置調(diào)整場景與重新設置新焦點位置的場景

    一、控件位置調(diào)整場景 移動過程中需要實時播報即將移動到的位置,新位置的播報會打斷老位置的播報,放置到確定位置后,需要再播報已經(jīng)放置的位置信息,盡量保證視障用戶耳朵聽到的信息和我們通過眼睛看到的信息
    發(fā)表于 10-25 09:49

    無線室內(nèi)定位系統(tǒng)是通過什么技術(shù)實現(xiàn)的呢?

    無線室內(nèi)定位系統(tǒng)作為現(xiàn)代科技的重要組成部分,廣泛應用于智能家居、企業(yè)管理、醫(yī)療護理等多個領域。這些系統(tǒng)通過不同的技術(shù)手段實現(xiàn)高精度的室內(nèi)定位,為用戶帶來便捷與高效。那么,無線室內(nèi)定位
    的頭像 發(fā)表于 09-10 09:28 ?749次閱讀
    無線室內(nèi)<b class='flag-5'>定位</b>系統(tǒng)是<b class='flag-5'>通過</b>什么技術(shù)實現(xiàn)的呢?

    突破傳統(tǒng)監(jiān)測模式:業(yè)務狀態(tài)監(jiān)控HM的新思路

    哪些?這就引出來數(shù)據(jù)監(jiān)控系統(tǒng)了。有小伙伴會問了,為什么業(yè)務狀態(tài)監(jiān)控系統(tǒng)可以補償?別急,往下看。 傳統(tǒng)監(jiān)控系統(tǒng)分為兩種,系統(tǒng)監(jiān)控和業(yè)務監(jiān)控。系統(tǒng)監(jiān)控有并發(fā)量監(jiān)控、異常監(jiān)控、調(diào)用鏈監(jiān)控、端口監(jiān)控、zabbix 監(jiān)控、htt
    的頭像 發(fā)表于 08-29 14:36 ?551次閱讀
    突破傳統(tǒng)監(jiān)測模式:業(yè)務狀態(tài)監(jiān)控HM的<b class='flag-5'>新思路</b>

    單北斗定位終端的優(yōu)勢在哪些場景下更加凸顯

    的準確性與可靠性,還通過實時動態(tài)追蹤與短報文通信功能,為安全管理與高效作業(yè)提供了強有力的技術(shù)支持。單北斗定位終端單北斗定位終端的優(yōu)勢在多個場景下更加凸顯,以下是一
    的頭像 發(fā)表于 08-21 10:29 ?928次閱讀
    單北斗<b class='flag-5'>定位</b>終端的優(yōu)勢在哪些<b class='flag-5'>場景</b>下更加凸顯

    人員定位技術(shù)有哪些?10種人員定位技術(shù)原理及應用場景介紹

    人員定位是一種通過使用各種技術(shù)手段來確定人員位置和軌跡的方法。它在許多領域具有廣泛的應用,包括安全監(jiān)控、緊急救援、物流管理、室內(nèi)導航等。本文將介紹一些常見的人員定位技術(shù),并探討它們的工作原理和應用
    的頭像 發(fā)表于 08-19 10:32 ?2408次閱讀
    人員<b class='flag-5'>定位</b>技術(shù)有哪些?10種人員<b class='flag-5'>定位</b>技術(shù)原理及應用<b class='flag-5'>場景</b>介紹

    高精度藍牙aoa定位原理和應用場景

    定位技術(shù)的定位精度可達10厘米到30厘米,?功能實現(xiàn)包括人員實時定位、?施工人員數(shù)量統(tǒng)計點名、?電子圍欄、?一鍵呼救、?危險情況預警等。是通過陣列天線感知發(fā)射節(jié)點信號的到達方向,?計算
    的頭像 發(fā)表于 08-05 21:51 ?1291次閱讀

    電廠人員定位怎么?分享電廠人員定位系統(tǒng)解決方案

    人員定位技術(shù)廣泛應用在各個行業(yè),對于電廠來說,人員定位能夠提升電廠人員管理效率,保障電廠員工人身安全。電廠人員定位怎么呢?我們一起來看看。 電廠人員
    的頭像 發(fā)表于 07-29 11:46 ?1045次閱讀
    電廠人員<b class='flag-5'>定位</b>怎么<b class='flag-5'>做</b>?分享電廠人員<b class='flag-5'>定位</b>系統(tǒng)解決方案

    園區(qū)人員定位怎么?分享智慧園區(qū)人員定位系統(tǒng)解決方案

    如今人工智能、物聯(lián)網(wǎng)、大數(shù)據(jù)、云計算等技術(shù)高速發(fā)展,將逐漸形成一個萬物互聯(lián)智能化的新時代,應用智慧化技術(shù)參與園區(qū)的規(guī)劃、建設和運營,打造新型智慧園區(qū)是大勢所趨。 打造智慧園區(qū)可通過部署人員定位系統(tǒng)來
    的頭像 發(fā)表于 07-29 11:44 ?1893次閱讀
    園區(qū)人員<b class='flag-5'>定位</b>怎么<b class='flag-5'>做</b>?分享智慧園區(qū)人員<b class='flag-5'>定位</b>系統(tǒng)解決方案