VSLAM系統(tǒng)方法的各種特點
近年來,基于視覺的傳感器在SLAM系統(tǒng)中顯示出顯著的性能、精度和效率提升。在這方面,視覺SLAM(V....
介紹一個重要的慣性框架數(shù)據(jù)集Berkeley DeepDrive Drone
研究自動駕駛車輛在復雜路況下的行為決策具有重要意義,但目前大多數(shù)自動駕駛數(shù)據(jù)集只關(guān)注結(jié)構(gòu)化場景,很少....
基于Transformer的越野場景可通行區(qū)域檢測模型OFF-Net
可通行區(qū)域檢測對于自動駕駛車輛的環(huán)境感知和路徑規(guī)劃至關(guān)重要。過去十年基于學習的可通行區(qū)域檢測算法取得....
基于文本驅(qū)動的三維模型風格化方法
來自華南理工大學、香港理工大學、跨維智能、鵬城實驗室等機構(gòu)的研究團隊提出了一種基于文本驅(qū)動的三維模型....
一個利用GT-SAM的緊耦合激光雷達慣導里程計的框架
LIO-SAM 提出了一個利用GT-SAM的緊耦合激光雷達慣導里程計的框架。實現(xiàn)了高精度、實時的移動....
一種手動校準Livox雷達和相機之間外參的方法
該功能包提供了一個手動校準Livox雷達和相機之間外參的方法,已經(jīng)在Mid-40,Horizon和T....
基于自動駕駛汽車記錄的3D激光掃描的SLAM閉環(huán)問題討論
同時定位和映射(SLAM)是大多數(shù)自主系統(tǒng)所需的基本能力。在本文中,我們討論了基于自動駕駛汽車記錄的....
TOIST借助COCO掩碼將問題擴展到實例分割問題實現(xiàn)更精細的定位
歸功于大規(guī)模視覺語言模型,名詞指代表達理解模型已經(jīng)取得了巨大的進展。然而,在像智能服務(wù)機器人這樣的現(xiàn)....
基于線段的激光雷達單目曲面重建
運動結(jié)構(gòu)(SfM)在缺乏合適的視覺特征的環(huán)境中往往無法估計出正確的位姿。在這種情況下,最終的三維網(wǎng)格....
為什么要對圖像做Gamma校正?
我以前講過,ISP在將圖像編碼為我們常用的8位圖像之前,會進行一次所謂的色調(diào)重建的過程。
ROS2概述和實踐入門
ROS?2007年發(fā)布以來,為機器?社區(qū)提供了?套相對完善的中間層、?具、軟件乃?通?的接?和標準,....
如何以模型和場景為中心的方式控制數(shù)據(jù)生成
首先,NeRF學習僅基于圖像數(shù)據(jù)和攝像頭姿態(tài)信息從新視圖生成數(shù)據(jù)。相反,傳統(tǒng)的圖形學流水線需要目標的....
基于Transform的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)FlowFormer用于光流量估計
光流估計任務(wù)要求輸出逐像素位移場f: R2→R2,將源圖像的每個二維位置x∈R2 Is映射到目標圖像....
第一個大規(guī)模點云的自監(jiān)督預訓練MAE算法Voxel-MAE
Voxel-MAE證明了對大規(guī)模點云進行基于掩碼的自監(jiān)督預訓練學習,來提高無人車的感知性能是可行的。....
Block nerf:可縮放的大型場景神經(jīng)視圖合成
為了在大場景中應用神經(jīng)輻射場(NeRF)模型,文章提出將大型場景分解為相互重疊的子場景 (block....
基于BlockNeRF的大場景規(guī)?;窠?jīng)視圖合成
為了在大場景中應用神經(jīng)輻射場(NeRF)模型,文章提出將大型場景分解為相互重疊的子場景 (block....
雙目視覺經(jīng)典視差優(yōu)化算法:Fast Bilateral-Space Stereo
事實上,這些指標都在強調(diào)視差圖在視差方向上的準確性,卻沒有怎么強調(diào)視差圖與原圖之間的貼合性——或者說....
通過機器視覺對PCB焊點缺陷檢測的應用方案
現(xiàn)代焊接的能量來源有很多種,包括氣體焰、電弧、激光、電子束、摩擦和超聲波等,隨著工業(yè)的發(fā)展和科技的不....
基于深度學習的焊接焊點缺陷檢測
深度學習主要包含卷積神經(jīng)網(wǎng)絡(luò)和Faster R-CNN兩種網(wǎng)絡(luò)模型,通過利用算法模型自動學習的特點,....
基于YOLO算法實現(xiàn)鋼筋數(shù)量的智能盤點
建筑工地在鋼筋成車來料時,需要人工清點數(shù)量,然后才能開展后續(xù)工作,不僅效率低,而且增加運營成本。....
如何直接建立2D圖像中的像素和3D點云中的點之間的對應關(guān)系
準確描述和檢測 2D 和 3D 關(guān)鍵點對于建立跨圖像和點云的對應關(guān)系至關(guān)重要。盡管已經(jīng)提出了大量基于....
基于SupSLAM的視覺慣性SLAM方法
近年來,使用機器學習技術(shù)進行特征提取的基于調(diào)制解調(diào)器特征的SLAM越來越受到關(guān)注,并有望在幾乎所有機....
一種R3LIVE++的LiDAR慣性視覺融合框架
R3LIVE++ 由實時運行的 LiDAR 慣性里程計 (LIO) 和視覺慣性里程計 (VIO) 組....
特征點提取器ORBextractor詳解
后面計算的是特征點主方向上的描述子,計算過程中要將特征點周圍像素旋轉(zhuǎn)到主方向上,因此計算一個半徑為1....
一種基于Transform的神經(jīng)網(wǎng)絡(luò)架構(gòu)
光流估計任務(wù)要求輸出逐像素位移場f: R2→R2,將源圖像的每個二維位置x∈R2 Is映射到目標圖像....
多目標跟蹤在計算機視覺中的重要性
目標跟蹤是計算機視覺中非常重要的任務(wù)之一。它剛好在目標檢測之后出現(xiàn)。為了完成目標跟蹤任務(wù),首先需要將....
圖像清晰度的評價方法
圖像清晰度是衡量圖像質(zhì)量的一個重要指標,對于相機來說,其一般工作在無參考圖像的模式下,所以在拍照時需....
一個全新的無監(jiān)督不需要明確物體種類的實例分割算法
這個問題也可以被解讀于:我們?nèi)绾瓮ㄟ^對現(xiàn)實世界中的部分信息來進行訓練學習,實現(xiàn)對激光點云中的實例物體....
通過RepSurf點云結(jié)構(gòu)實現(xiàn)多項任務(wù)SOTA
大多數(shù)先前的工作通過坐標表示點云的形狀。然而,直接利用坐標描述局部幾何是不充分的。在本文中,我們提出....