九種3D Lidar-SLAM算法評估
當(dāng)機器人處在照明條件不足且無法使用GPS的地下(SubT)環(huán)境中,其自主導(dǎo)航是一項極具挑戰(zhàn)性的任務(wù),....
3D視覺,如何快速接點「私活」?
在工坊平臺,常常會有企業(yè)老板聯(lián)系我們,希望工坊能夠快速幫忙對接相應(yīng)人才,以幫忙解決項目中棘手的難題,....
通用視覺GPT時刻來臨?智源推出通用分割模型SegGPT
無論是 “一觸即通” 還是 “一通百通”,都意味著視覺模型已經(jīng) “理解” 了圖像結(jié)構(gòu)。SAM 精細標(biāo)....
基于深度學(xué)習(xí)立體匹配的基本網(wǎng)絡(luò)結(jié)構(gòu)和變種
我們可以利用下圖來描述它們的共同點,它們都是由左右兩條分支組成了特征提取的網(wǎng)絡(luò),提取出來的特征圖都會....
CVPR2023:IDEA與清華提出首個一階段3D全身人體網(wǎng)格重建算法
三維全身人體網(wǎng)格重建(3D Whole-Body Mesh Recovery)是人類行為建模的一個重....
基于imu定位的方法,如何解決累積誤差?
現(xiàn)在精度最好的imu一個小時會累積幾十米的誤差,價格上百萬美元,用在洲際彈道導(dǎo)彈上的(你老板買得起?....
GPU利用率低常見原因分析及優(yōu)化
本文的 GPU 利用率主要指 GPU 在時間片上的利用率,即通過 nvidia-smi 顯示的 GP....
ImPosing:用于視覺定位的隱式姿態(tài)編碼
先通過圖像編碼器計算表示圖像向量。然后通過評估分布在地圖上的初始姿態(tài)候選來搜索相機姿態(tài)。姿態(tài)編碼器對....
自動駕駛建圖定位之RTK簡介
移動站和基站觀測到的共同衛(wèi)星數(shù):RTK精確定位要求要求移動站與基站觀測到5顆以上同樣的多頻段衛(wèi)星才能....
基于YOLOv7的關(guān)鍵點模型測評
今年4月,yolo-pose也掛在了arvix,在論文中,通過調(diào)研發(fā)現(xiàn) HeatMap 的方式普遍使....
NeRF2NeRF神經(jīng)輻射場的配對配準(zhǔn)介紹
我們介紹了一種神經(jīng)場成對配準(zhǔn)的技術(shù),它擴展了基于優(yōu)化的經(jīng)典局部配準(zhǔn)(即ICP)以操作神經(jīng)輻射場(Ne....
DeepFusion:基于激光雷達和相機深度融合的多模態(tài)3D目標(biāo)檢測
在Waymo Open Dataset上,DeepFusion分別提高了幾種主流的3D檢測模型的精度....
人臉識別路漫漫:清華、北大等提出AT3D人臉識別系統(tǒng)攻擊方法
如上圖中打印一張人臉紋理紙貼臉上,這種人看起來怪怪的操作,早期也是可以讓人臉識別系統(tǒng)陷入錯誤的,但在....
OpenCV中八種不同的目標(biāo)追蹤算法
分類器的任務(wù)是將圖像的矩形區(qū)域分類為對象或背景。分類器接受圖像區(qū)域作為輸入,并返回介于0和1之間的分....
復(fù)雜約束下自動駕駛車輛的運動規(guī)劃解析
車輛運動受到運動學(xué)約束,比如它不能實現(xiàn)瞬時側(cè)向移動,前驅(qū)的車輛必須依賴前輪的轉(zhuǎn)向才能實現(xiàn)變道、轉(zhuǎn)向等....
運動目標(biāo)檢測算法簡介及其應(yīng)用
運動目標(biāo)檢測的主要目的是從圖片序列中將變化區(qū)域或者運動物體從背景圖像中分離出來,常用于視頻監(jiān)控、異常....
Point-NN: 即插即用,無需訓(xùn)練的非參數(shù)點云分析網(wǎng)絡(luò)!
從PointNet++起,包括最遠點采樣(FPS)、k近鄰(k-NN)和池化操作在內(nèi),所有可學(xué)習(xí)模塊....
從零學(xué)習(xí)自動駕駛—百度Apollo高精地圖
首先需要解決的問題是——什么是高精地圖?這要先從我們平時開車、出行所使用的導(dǎo)航地圖說起。當(dāng)我們想去某....
自動駕駛路徑規(guī)劃:A*(Astar)算法
要實現(xiàn)最佳優(yōu)先搜索我們必須使用一個優(yōu)先隊列(priority queue)來實現(xiàn),通常采用一個ope....
OpenAI發(fā)布GPT-4,有哪些技術(shù)趨勢值得關(guān)注?
在這個情形下,其它技術(shù)相對領(lǐng)先的公司有兩種選擇。一種是做更極致的LLM開源化,比如Meta貌似選擇了....
GO-Surf: 用于快速、高保真RGB-D表面重建的神經(jīng)特征網(wǎng)格優(yōu)化
GO-Surf使用多級特征網(wǎng)格和兩個淺層MLP解碼器。給定一個沿射線的采樣點,每個網(wǎng)格通過三線插值進....
機器人導(dǎo)航技術(shù):SLAM創(chuàng)新點前世今生分析
SLAM(simultaneous localization and mapping)全稱即時定位與....
介紹第一個結(jié)合相對和絕對深度的多模態(tài)單目深度估計網(wǎng)絡(luò)
單目深度估計分為兩個派系,metric depth estimation(度量深度估計,也稱絕對深度....
OV2SLAM(高速視覺slam)簡析
視覺里程計最近幾年越來越受到學(xué)術(shù)界以及工業(yè)界的認(rèn)可,以O(shè)RB和VINS為代表的視覺SLAM已經(jīng)可以滿....
用于快速高保真RGB-D表面重建的神經(jīng)特征網(wǎng)格優(yōu)化的GO-Surf
我們提出了GO-Surf,一種直接的特征網(wǎng)格優(yōu)化方法,用于從RGB-D序列中準(zhǔn)確和快速地重建表面。
教你如何做機器人與視覺的融合仿真
四旋翼無人機自發(fā)明以來已經(jīng)有了非常長遠的發(fā)展,現(xiàn)階段對四旋翼無人機的運動學(xué)和動力學(xué)模型已經(jīng)有了很多較....
路徑規(guī)劃算法之柵格地圖繪制
a. 本欄路徑規(guī)劃利用矩陣(二維數(shù)組)來表示柵格地圖(因為對于矩陣,無論MATLAB、C++還是Py....
一種用于自監(jiān)督單目深度估計的輕量級CNN和Transformer架構(gòu)
自監(jiān)督單目深度估計不需要地面實況訓(xùn)練,近年來受到廣泛關(guān)注。設(shè)計輕量級但有效的模型非常有意義,這樣它們....