一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

港中文和商湯研究員提出高效的三維點云目標(biāo)檢測?新框架

nlfO_thejiangme ? 來源:lq ? 2019-08-02 14:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

激光雷達(dá)在自動駕駛無人機(jī)機(jī)器人領(lǐng)域受到越來越多的關(guān)注,對于點云的分類、檢測和分割的視覺任務(wù)也在高速發(fā)展。但由于激光雷達(dá)產(chǎn)生的點云十分稀疏且不規(guī)則,圖像領(lǐng)域的方法無法有效地拓展到三維點云的分析和處理中。

為了有效處理這一問題,來自香港中文大學(xué)和商湯的研究人員們通過對目標(biāo)的部分感知和聚合對點云特征進(jìn)行抽取和分析,提出了可以精確預(yù)測目標(biāo)內(nèi)部相對位置并給出三維候選框的網(wǎng)絡(luò)架構(gòu);同時利用可差分的ROI-aware池化和點云聚合網(wǎng)絡(luò)對內(nèi)部信息進(jìn)行提取和聚合;最后在目標(biāo)內(nèi)部各部分空間相關(guān)信息的輔助下實現(xiàn)了高效的三維點云目標(biāo)檢測算法Part-A^2 Net(Part-Aware and Aggregation)。

圖中可以看到預(yù)測出的結(jié)果不僅包含了每個框的坐標(biāo),目標(biāo)內(nèi)部點的顏色還表示了每個點的相對位置,對于提高目標(biāo)檢測的性能十分重要。

目前的三維檢測算法主要集中在以下幾個方法。

一類方法將點云投影到鳥瞰視圖下并利用2D的卷積網(wǎng)絡(luò)進(jìn)行特征抽取從而實現(xiàn)三維目標(biāo)檢測;

另一類方法則將三維空間劃分為規(guī)則的體素,并利用三維(稀疏)卷積進(jìn)行特征抽??;

還有的方法利用點云與圖像結(jié)合,在二維圖像中檢測出目標(biāo)bbox隨后利用PointNet基于2D結(jié)果對點云進(jìn)行裁剪和處理并獲取三維框。

但這些方法都會受到來自投影過程、體素量化過程或2D目標(biāo)檢測器造成信息損失的影響,無法精確有效地進(jìn)行三維點云的目標(biāo)檢測。為了更有效地處理三維點云,研究人員們開始嘗試直接從點云中抽取特征生成3D候選框,利用三維bbox標(biāo)注直接生成對前景和背景進(jìn)行有效分離的標(biāo)簽。在此過程中研究人員發(fā)現(xiàn)三維bbox不僅提供了分割的標(biāo)簽,同時還精確地給出了目標(biāo)內(nèi)部各部分精確的相對位置。

與二維圖像中會相互遮擋的物體不同,三維點云中的物體都是天然分離的,使得三維目標(biāo)內(nèi)部各個部分的相對位置可以精確獲取,這些方法將有效提高目標(biāo)檢測方法的性能。基于這樣的觀察結(jié)果,研究人員提出了一個部分感知和聚合的網(wǎng)絡(luò)結(jié)構(gòu)來進(jìn)行三維點云目標(biāo)檢測。

研究人員從三維標(biāo)注數(shù)據(jù)獲得的目標(biāo)內(nèi)部各部分的相對位置標(biāo)簽和分割標(biāo)簽來輔助三維候選框的生成過程,隨后對每個候選框內(nèi)的3D目標(biāo)部分位置進(jìn)行聚合來為bbox評分并對框的位置進(jìn)行優(yōu)化。這種方法為點云處理提供了新的視角,并幫助算法在目標(biāo)檢測中取得更好的結(jié)果。

上圖中可以看到算法分為了兩個主要的部分,部分感知模塊用于精確估計目標(biāo)內(nèi)部各個部分/點間的相對位置,同時給出三維的候選框;聚合部分針對每個候選框內(nèi)的點進(jìn)行ROI池化和分組,實現(xiàn)特征抽取;隨后利用聚合網(wǎng)絡(luò)來對框進(jìn)行評測并給予內(nèi)部的相對空間信息對位置進(jìn)行優(yōu)化。

估計對象內(nèi)各部分的位置

為了有效分離出點云中的前景和背景并預(yù)測出對象內(nèi)部各部分的相對位置,需要從點云中獲取可分辨的逐點特征。

研究人員首先使用了體素化的三維空間并利用卷積對非空的體素進(jìn)行特征抽取。每個體素的中心被視為一個新的點,這些點構(gòu)成了一個與原始點云近似的新點云(體素大小5cm5cm10cm,空間大小70m80m4m)。在使用的KITTI數(shù)據(jù)中每個數(shù)據(jù)樣本包含了大概16000非空的體素。

用于特征抽取額U-Net架構(gòu)和對應(yīng)的上采樣模塊

為了對稀疏的體素信息進(jìn)行高效的處理,研究人員利用U-Net的架構(gòu)對點云進(jìn)行了下采樣和特征抽取。為了得到前景分割和各部分位置的預(yù)測,還需要對進(jìn)行上采樣解碼。模塊中同時對隱含特征和底層特征進(jìn)行融合,最后通過稀疏逆卷積實現(xiàn)下采樣。

對象內(nèi)各部分的相對位置信息是網(wǎng)絡(luò)對目標(biāo)進(jìn)行識別和檢測的保證。例如車輛的側(cè)面幾乎是垂直于地面的,而輪子是與地面相接觸的。通過學(xué)習(xí)和估計前景分割和目標(biāo)內(nèi)部各個點的相對位移關(guān)系將使得網(wǎng)絡(luò)可以學(xué)會推理出目標(biāo)的位姿和形態(tài),提高檢測性能。在U-Net主干網(wǎng)絡(luò)的基礎(chǔ)上,模型通過兩個分支分別進(jìn)行前景分割和目標(biāo)內(nèi)部個部分的位置預(yù)測。針對目標(biāo)內(nèi)部的點,需要先將全局的三維坐標(biāo)轉(zhuǎn)換為局部的坐標(biāo)進(jìn)行分析。在三維點云的bbox中天然的包含了框中每一個點在對象內(nèi)部的坐標(biāo)。研究人員通過將目標(biāo)內(nèi)部的點轉(zhuǎn)換到框原點坐標(biāo)系中并利用框的w,l.h來歸一化,得到了內(nèi)部點在內(nèi)部坐標(biāo)系下的新表示,并作為預(yù)測內(nèi)部各部分點相對位置的標(biāo)簽。網(wǎng)絡(luò)將通過優(yōu)化二值化的交叉熵來實現(xiàn)對于每一個對象內(nèi)部點相對位置的預(yù)測。

最后為了生成三維候選框來聚合各個目標(biāo)內(nèi)部的位置信息,研究人員在U-Net的特征圖位置補(bǔ)充了一個RPN(regional proposal network)結(jié)構(gòu),通過對1/8下采樣的特征圖和不同高度融合的鳥瞰特征圖進(jìn)行處理生成3D候選區(qū)域。

具有ROI感知的點云特征池化

在得到目標(biāo)內(nèi)部各個的相對位置和一系列的三維候選框后,將要對box進(jìn)行評分,并通過聚合同一候選框內(nèi)的所有點的相對信息來實現(xiàn)候選框的位置優(yōu)化。

為了避免池化帶來了信息損失和模糊,研究人員提出了ROI感知的點云池化模塊,將3D候選分配到固定大小(14*14*14)的均勻體素中去。體素中的特征通過(最大池化,均值池化)聚合內(nèi)部點的特征來得到,并將空體素的特征設(shè)置為0。池化過程中聯(lián)合編碼空體素。這一過程將不同的三維候選框歸一化到了相同的坐標(biāo)系下,其中每個體素都編碼了對應(yīng)候選框中柵格特征。

內(nèi)部位置的聚合與三維bbox的優(yōu)化

研究人員通過聚合候選框內(nèi)部所有三維點的內(nèi)部相對位置來評價候選框的質(zhì)量,并通過基于學(xué)習(xí)的優(yōu)化方法來解決這一問題。

針對每個三維候選框,首先通過平均池化預(yù)測每個點的位置,通過最大池化獲取每個點的特征。隨后通過逐級處理的方式來最終預(yù)測最終的得分與優(yōu)化后的bbox坐標(biāo)。

結(jié)果

在實驗過程中,研究人員結(jié)合了三部分的損失函數(shù)來對模型進(jìn)行了訓(xùn)練,分別是復(fù)雜前景分割的focal損失,負(fù)責(zé)回歸每個內(nèi)部點相對位移的二進(jìn)制交叉熵以及負(fù)責(zé)進(jìn)行三維候選框生成的平滑L1損失。

針對聚合階段還包括了IoU回歸的二進(jìn)制交叉熵以及位置優(yōu)化的平滑L1。研究人員在KITTI上進(jìn)行了實現(xiàn),下表顯示了這一方法在平均精度上顯著高于先前的解決方案。

同時消溶性分析還顯示這一方法通過對于特征的有效學(xué)習(xí)有效提高了召回率和精度。

最終的結(jié)果可以看到對于場景中車輛的預(yù)測性能優(yōu)異,而每個框內(nèi)的部分位置也實現(xiàn)了較為精確的預(yù)測。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 激光雷達(dá)
    +關(guān)注

    關(guān)注

    971

    文章

    4236

    瀏覽量

    192899
  • 三維檢測
    +關(guān)注

    關(guān)注

    0

    文章

    16

    瀏覽量

    2280

原文標(biāo)題:深度解析 | 港中文和商湯研究員提出高效的三維點云目標(biāo)檢測?新框架

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于深度學(xué)習(xí)的三維配準(zhǔn)方法

    基于深度學(xué)習(xí)的三維配準(zhǔn)方法成為研究的主流,并隨之誕生了DeepVCP、DGR、Predator等著名的方法。
    發(fā)表于 11-29 11:41 ?2153次閱讀

    精密鑄造+三維掃描=機(jī)械制造完美解決方案

    ;step3.數(shù)模與掃描數(shù)據(jù)進(jìn)行擬合對齊,進(jìn)行三維檢測分析;step4.根據(jù)檢測數(shù)據(jù)對產(chǎn)品外形進(jìn)行修正優(yōu)化。/ 04 /掃描數(shù)據(jù)結(jié)果▼鑄件連桿掃描數(shù)據(jù)▲鑄件連桿的
    發(fā)表于 08-09 11:17

    如何快速高效的完成汽車前蓋板的三維檢測

    如何快速高效的完成汽車前蓋板的三維檢測?行業(yè)背景汽車的前蓋板在生產(chǎn)出來后往往因為焊接和零件的誤差難以裝配,檢測便成了生產(chǎn)和安裝兩個環(huán)節(jié)之間的重要步驟??s短
    發(fā)表于 08-11 14:16

    三維檢測汽車零件 幫助汽車性能達(dá)標(biāo)

    ]三維及stl數(shù)據(jù)STEP4:數(shù)模與掃描數(shù)據(jù)進(jìn)行擬合對齊,進(jìn)行檢測分析[img][/img]三維檢測
    發(fā)表于 08-21 10:48

    三維快速建模技術(shù)與三維掃描建模的應(yīng)用

    的HANDYSCAN三維激光掃描儀采集它的三維信息,然后利用Vxelements軟件對多站式
    發(fā)表于 08-07 11:14

    一種基于概率框架三維生成模型PointFlow

    作為三維數(shù)據(jù)的重要形式,由于較高的分辨率和對復(fù)雜細(xì)節(jié)更好的表達(dá)越來越受到研究人員的青睞。有效的
    的頭像 發(fā)表于 08-02 14:32 ?6884次閱讀

    基于深度學(xué)習(xí)的三維語義分割研究分析

    近年來,深度傳感器和三維激光掃描儀的普及推動了三維處理方法的快速發(fā)展。語義分割作為理解
    發(fā)表于 04-01 14:48 ?16次下載
    基于深度學(xué)習(xí)的<b class='flag-5'>三維</b><b class='flag-5'>點</b><b class='flag-5'>云</b>語義分割<b class='flag-5'>研究</b>分析

    基于激光雷達(dá)三維目標(biāo)檢測算法

    文中提出了一種基于激光雷達(dá)三維目標(biāo)檢測算法 Voxeircnn( Voxelization
    發(fā)表于 05-08 16:35 ?45次下載

    的概念以及與三維圖像的關(guān)系

    概念 三維圖像的關(guān)系:三維圖像是一種特殊的信息表達(dá)形式,其特征是表達(dá)的空間中
    的頭像 發(fā)表于 08-17 09:18 ?7883次閱讀
    <b class='flag-5'>點</b><b class='flag-5'>云</b>的概念以及與<b class='flag-5'>三維</b>圖像的關(guān)系

    基于三維激光目標(biāo)識別與跟蹤研究

    基于三維激光目標(biāo)識別與跟蹤研究 來源:《汽車工程》 ,作者徐國艷等 [摘要] 針對無人車環(huán)境感知中的障礙物
    發(fā)表于 01-17 11:22 ?948次閱讀

    基于三維激光目標(biāo)識別與跟蹤研究

    基于三維激光目標(biāo)識別與跟蹤研究 來源:《汽車工程》?,作者徐國艷等 [摘要]?針對無人車環(huán)境感知中的障礙物
    的頭像 發(fā)表于 02-15 13:36 ?3353次閱讀
    基于<b class='flag-5'>三維</b>激光<b class='flag-5'>點</b><b class='flag-5'>云</b>的<b class='flag-5'>目標(biāo)</b>識別與跟蹤<b class='flag-5'>研究</b>

    三維數(shù)據(jù)的兩種結(jié)構(gòu)Kdtree和Octree

    三維數(shù)據(jù)用于表征目標(biāo)表面的海量集合,但是各個離散之間并沒有拓?fù)潢P(guān)系,一般通過建立
    的頭像 發(fā)表于 03-14 10:57 ?8208次閱讀

    什么樣的可以稱為三維云中的關(guān)鍵呢?

    本工作受D2-Net啟發(fā),提出了一種新的三維關(guān)鍵點定義方式,將其與三維的特征描述子關(guān)聯(lián)起來
    的頭像 發(fā)表于 11-22 09:46 ?1647次閱讀

    三維計算視覺研究分析

    三維計算視覺研究內(nèi)容包括: 1)三維匹配 :兩幀或者多幀數(shù)據(jù)之間的匹配,因為激光掃描光束受物體遮擋的原因,不可能通過一次掃描完成對整個物
    的頭像 發(fā)表于 06-19 11:06 ?998次閱讀

    友思特方案 基于三維實現(xiàn)PCB裝配螺絲視覺檢測

    三維是完成精密化 PCB 檢測的最新視覺技術(shù)。友思特 Saccde Vision 視覺掃描系統(tǒng),采用先進(jìn)的三維成像技術(shù)和算法輸出直觀點云
    的頭像 發(fā)表于 08-28 16:35 ?641次閱讀
    友思特方案  基于<b class='flag-5'>三維</b><b class='flag-5'>點</b><b class='flag-5'>云</b>實現(xiàn)PCB裝配螺絲視覺<b class='flag-5'>檢測</b>