一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用于處理三維點云的深度學習方法的分析

3D視覺工坊 ? 來源:arxiv ? 作者:Yulan Guo, Hanyun Wan ? 2022-11-02 15:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

3D點云學習( Point Clouds)作為近年來的研究熱點之一,受到了廣泛關注,每年在各大會議上都有大量的相關文章發(fā)表。當前,點云上的深度學習變得越來越流行,人們提出了許多方法來解決這一領域的不同問題。國防科技大學郭裕蘭老師課題組新出的這篇論文對近幾年點云深度學習方法進行了全面綜述,是第一篇全面涵蓋多個重要點云相關任務的深度學習方法的綜述論文,包括三維形狀分類、三維目標檢測與跟蹤、三維點云分割等,并對點云深度學習的機制和策略進行全面的歸納和解讀,幫助讀者更好地了解當前的研究現(xiàn)狀和思路。也提供了現(xiàn)有方法在幾個可公開獲得的數(shù)據(jù)集上的全面比較,最后也介紹了未來的研究方向。

a98b47ca-4ca5-11ed-a3b6-dac502259ad0.png

對于3D點云,數(shù)據(jù)正在迅速增長。大有從2D向3D發(fā)展的趨勢,比如在opencv中就已經(jīng)慢慢包含了3D點云的處理的相關模塊,在數(shù)據(jù)方面點云的獲取也是有多種渠道, 無論是源于CAD模型還是來自LiDAR傳感器或RGBD相機的掃描點云,無處不在。另外,大多數(shù)系統(tǒng)直接獲取3D點云而不是拍攝圖像并進行處理。因此,在深度學習大火的年代,應該如何應用這些令人驚嘆的深度學習工具,在3D點云上的處理上達到對二維圖像那樣起到很好的作用呢?

3D點云應用深度學習面臨的挑戰(zhàn)。首先在神經(jīng)網(wǎng)絡上面臨的挑戰(zhàn):

(1)非結構化數(shù)據(jù)(無網(wǎng)格):點云是分布在空間中的XYZ點。沒有結構化的網(wǎng)格來幫助CNN濾波器

(2)不變性排列:點云本質上是一長串點(nx3矩陣,其中n是點數(shù))。在幾何上,點的順序不影響它在底層矩陣結構中的表示方式,例如, 相同的點云可以由兩個完全不同的矩陣表示。如下圖所示:

(3)點云數(shù)量上的變化:在圖像中,像素的數(shù)量是一個給定的常數(shù),取決于相機。然而,點云的數(shù)量可能會有很大的變化,這取決于各種傳感器。

a99ae824-4ca5-11ed-a3b6-dac502259ad0.png

在點云數(shù)據(jù)方面的挑戰(zhàn):

(1)缺少數(shù)據(jù):掃描的模型通常被遮擋,部分數(shù)據(jù)丟失。
(2)噪音:所有傳感器都是嘈雜的。有幾種類型的噪聲,包括點云擾動和異常值。這意味著一個點有一定的概率位于它被采樣的地方(擾動)附近的某一半徑范圍內,或者它可能出現(xiàn)在空間的任意位置(異常值)。
(3)旋轉:一輛車向左轉,同一輛車向右轉,會有不同的點云代表同一輛車。

a9bc9942-4ca5-11ed-a3b6-dac502259ad0.png

點云學習近年來受到越來越多的關注,因為它在許多領域都有廣泛的應用,比如計算機視覺、自動駕駛機器人技術。作為人工智能的主要技術之一,深度學習已經(jīng)成功地用于解決各種二維視覺問題。然而,由于使用深度神經(jīng)網(wǎng)絡處理點云所面臨的獨特挑戰(zhàn),對點云的深度學習仍處于起步階段。最近,點云上的深度學習變得越來越流行,人們提出了許多方法來解決這一領域的不同問題。為了激發(fā)未來的研究,本文對點云深度學習方法的最新進展進行了綜述。它涵蓋了三個主要任務,包括三維形狀分類,三維目標檢測和跟蹤以及三維點云分割。我們還提供了一些可公開獲得的數(shù)據(jù)集的比較結果,以及有見地的觀察和啟發(fā)性的未來研究方向。

引言

3D數(shù)據(jù)在不同的領域有許多應用,包括自動駕駛、機器人、遙感、醫(yī)療和設計行業(yè)[4]。近年來,深度學習技術在計算機視覺、語音識別、自然語言處理(NLP)、生物信息學等研究領域占據(jù)主導地位。但是,在三維點云上進行深度學習仍然面臨數(shù)個重大挑戰(zhàn)[5],例如數(shù)據(jù)集規(guī)模小,維數(shù)高和三維點云的非結構化性質。在此基礎上,本文重點分析了用于處理三維點云的深度學習方法。

一些公開的數(shù)據(jù)集也被發(fā)布,例如ModelNet [6],ShapeNet [7],ScanNet [8],Semantic3D [9]和KITTI Vision Benchmark Suite[10]。這些數(shù)據(jù)集進一步推動了對三維點云的深度學習研究,提出了越來越多的方法來解決與點云處理相關的各種問題,包括三維形狀分類、三維目標檢測與跟蹤、三維點云分割等。

這篇論文是第一個專門針對點云的深度學習方法的綜述。此外,論文全面涵蓋了分類,檢測,跟蹤和分割等不同應用。圖1顯示了三維點云的現(xiàn)有深度學習方法的分類。

a9ee28f4-4ca5-11ed-a3b6-dac502259ad0.png

圖1:三維點云深度學習方法分類。

這項工作的主要貢獻可以概括如下:

· 1)據(jù)我們所知,這是第一篇全面涵蓋多個重要點云相關任務的深度學習方法的綜述論文,包括三維形狀分類、三維目標檢測與跟蹤、三維點云分割等。

·2)相對于已有的綜述[11],[12],我們特別關注三維點云的深度學習方法,而不是所有類型的三維數(shù)據(jù)。

· 3)本文介紹了點云深度學習的最新進展。因此,它為讀者提供了最先進的方法。

·4)提供了現(xiàn)有方法在幾個可公開獲得的數(shù)據(jù)集上的全面比較(例如,表1、2、3、4),并提供了簡要的總結和深入的討論。

本文的結構如下。第2節(jié)回顧了三維形狀分類的方法。第3節(jié)概述了現(xiàn)有的三維目標檢測和跟蹤方法。第4節(jié)介紹了點云分割的方法,包括語義分割、實例分割和部件分割。最后,第5節(jié)總結了論文。

論文還在以下網(wǎng)址上提供了定期更新的項目頁面:

https://github.com/QingyongHu/SoTA-Point-Cloud

aa0112f2-4ca5-11ed-a3b6-dac502259ad0.png

圖2:三維形狀分類網(wǎng)絡的時間順序概覽。

aa0c5c70-4ca5-11ed-a3b6-dac502259ad0.png

圖3:PointNet的體系結構。

aa29f758-4ca5-11ed-a3b6-dac502259ad0.png

圖4:點的局部鄰居的連續(xù)和離散卷積的圖解。(a)代表一個局部鄰居;(b)和(c)分別表示三維連續(xù)卷積和離散卷積。

aa31cb18-4ca5-11ed-a3b6-dac502259ad0.png

圖5:基于圖的網(wǎng)絡的圖解。

aa36f8c2-4ca5-11ed-a3b6-dac502259ad0.png

表1:在ModelNet10/40基準上比較三維形狀分類結果。這里,我們只關注基于點的網(wǎng)絡,“#params”表示相應模型的參數(shù)數(shù)量?!癘A”表示總體精度,“mAcc”表示表中的平均精度。符號“-”表示結果不可用。

aa5fe07a-4ca5-11ed-a3b6-dac502259ad0.png

圖6:按時間順序概述的最相關的基于深度學習的三維目標檢測方法。

aa7d59b6-4ca5-11ed-a3b6-dac502259ad0.png

圖7:三類三維目標檢測方法的典型網(wǎng)絡。從上到下:(a)基于多視圖,(b)基于分割,(c)基于視錐的方法。

aab5ab86-4ca5-11ed-a3b6-dac502259ad0.png

表2:在KITTI測試三維檢測基準上的三維目標檢測結果對比。

aad4ce6c-4ca5-11ed-a3b6-dac502259ad0.png

表3:在KITTI test BEV檢測基準上三維目標檢測結果對比。

ab10723c-4ca5-11ed-a3b6-dac502259ad0.png

圖8:按時間順序概述了一些最相關的基于深度學習的點云語義分割方法。

ab2c5cea-4ca5-11ed-a3b6-dac502259ad0.png

圖9:基于投影方法的中間表示圖。

ab9ae250-4ca5-11ed-a3b6-dac502259ad0.png

圖10:PointNet++[27]框架的示意圖。

aba1da10-4ca5-11ed-a3b6-dac502259ad0.png

圖11:有代表性的三維點云實例分割方法的年代概述。

未來方向

表4展示了現(xiàn)有方法在公共基準測試上的結果,包括S3DIS[176]、Semantic3D[9]、ScanNet[102]、SemanticKITTI[177]。需要進一步研究的問題有:

·基于點的網(wǎng)絡是最常被研究的方法。然而,點表示自然不具有顯式的鄰近信息,現(xiàn)有的大多數(shù)基于點的方法不得不借助于昂貴的鄰近搜索機制(如KNN[52]或ball query [27])。這從本質上限制了這些方法的效率,因為鄰居搜索機制既需要很高的計算成本,又需要不規(guī)則的內存訪問[214]。

·從不平衡數(shù)據(jù)中學習仍然是點云分割中一個具有挑戰(zhàn)性的問題。雖然有幾種的方法取得了顯著的綜合成績[42]、[170]、[182],但它們在類標很少的情況下表現(xiàn)仍然有限。例如,RandLA-Net[95]在Semantic3D的reduced-8子集上獲得了76.0%的整體IoU,而在hardscape類上獲得了41.1%的非常低的IoU。

·大多數(shù)現(xiàn)有的方法[5]、[27]、[52]、[170]、[171]都適用于小點云(如1m*1m,共4096個點)。在實際中,深度傳感器獲取的點云通常是巨大的、大規(guī)模的。因此,有必要進一步研究大規(guī)模點云的有效分割問題。

·已有少數(shù)文獻[145]、[146]、[167]開始研究動態(tài)點云的時空信息。預期時空信息可以幫助提高后續(xù)任務的性能,如三維目標識別、分割和完成。

abd31800-4ca5-11ed-a3b6-dac502259ad0.png

表4:S3DIS(包括Area5和6-fold cross validation)[176]、Semantic3D(包括semantic-8和reduced-8子集)[9]、ScanNet[8]和SemanticKITTI[177]數(shù)據(jù)集的語義分割結果對比。

結論

本文介紹了最先進的三維理解方法,包括三維形狀分類,三維目標檢測和跟蹤,以及三維場景和目標分割。對這些方法進行了全面的分類和性能比較。介紹了各種方法的優(yōu)缺點,并提出了今后的研究方向。

作者:Yulan Guo, Hanyun Wang, Qingyong Hu, Hao Liu, Li Liu, and Mohammed Bennamoun

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機
    +關注

    關注

    19

    文章

    7663

    瀏覽量

    90824
  • 自動駕駛
    +關注

    關注

    790

    文章

    14321

    瀏覽量

    170689
  • 深度學習
    +關注

    關注

    73

    文章

    5561

    瀏覽量

    122799

原文標題:3D點云分割、目標檢測、分類

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    VirtualLab:光學系統(tǒng)的三維可視化

    摘要 為了對光學系統(tǒng)的性質有一個基本的了解,對其組件的可視化和光傳播的提示是非常有幫助的。為此,VirtualLab Fusion提供了一個工具來顯示光學系統(tǒng)的三維視圖。這些工具可以進一步用于檢查
    發(fā)表于 05-30 08:45

    南方測繪推出實景三維中國整體解決方案

    新型基礎測繪與實景三維中國建設持續(xù)推進,南方測繪深度聚焦,基于自主研發(fā)的SmartGIS平臺,打造以地理實體數(shù)據(jù)為核心的“生產(chǎn)、處理、質檢、管理、可視化分析”實景
    的頭像 發(fā)表于 03-26 16:44 ?662次閱讀

    三維測量在醫(yī)療領域的應用

    三維測量在醫(yī)療領域的應用十分廣泛,為醫(yī)療診斷、治療及手術規(guī)劃等提供了重要的技術支持。以下是對三維測量在醫(yī)療領域應用的分析: 一、醫(yī)學影像的三維重建與
    的頭像 發(fā)表于 12-30 15:21 ?678次閱讀

    三維測量數(shù)據(jù)處理流程

    一系列的處理步驟才能轉化為有用的信息。 1. 數(shù)據(jù)采集 三維測量數(shù)據(jù)處理的第一步是數(shù)據(jù)采集。這一步驟涉及到使用各種傳感器和設備來獲取三維空間中的
    的頭像 發(fā)表于 12-30 15:06 ?769次閱讀

    三維測量軟件的使用技巧

    需要哪些功能,如處理三維建模、數(shù)據(jù)分析等。 軟件兼容性 :確保軟件能夠與現(xiàn)有的硬件設備兼容,如三維
    的頭像 發(fā)表于 12-30 15:05 ?835次閱讀

    常見的三維測量方法和工具

    三維測量是用于獲取物體三維幾何信息的技術,它在工業(yè)制造、建筑、考古、醫(yī)學等領域有著廣泛的應用。以下是一些常見的三維測量方法和工具的概述,以及
    的頭像 發(fā)表于 12-30 15:02 ?1099次閱讀

    傳統(tǒng)機器學習方法和應用指導

    開發(fā)生物學數(shù)據(jù)的機器學習方法。盡管深度學習(一般指神經(jīng)網(wǎng)絡算法)是一個強大的工具,目前也非常流行,但它的應用領域仍然有限。與深度學習相比,傳
    的頭像 發(fā)表于 12-30 09:16 ?1192次閱讀
    傳統(tǒng)機器<b class='flag-5'>學習方法</b>和應用指導

    南方智能SmartGIS Inspec實景三維質檢軟件介紹

    新型基礎測繪與實景三維中國建設持續(xù)推進,南方測繪集團旗下南方智能深度聚焦,基于自主研發(fā)的SmartGIS平臺,打造以地理實體數(shù)據(jù)為核心的“生產(chǎn)、處理、質檢、管理、可視化分析”實景
    的頭像 發(fā)表于 12-27 11:20 ?1365次閱讀

    建筑物邊緣感知和邊緣融合的多視圖立體三維重建方法

    航空建筑深度估計是三維數(shù)字城市重建中的一項重要任務,基于深度學習的多視圖立體(MVS)方法在該領域取得了較好的成果。目前的主要
    的頭像 發(fā)表于 11-07 10:16 ?934次閱讀
    建筑物邊緣感知和邊緣融合的多視圖立體<b class='flag-5'>三維</b>重建<b class='flag-5'>方法</b>

    南方智能推出三維地理實體生產(chǎn)軟件

    新型基礎測繪與實景三維中國建設持續(xù)推進,南方智能深度聚焦,基于自主研發(fā)的SmartGIS平臺,打造以地理實體數(shù)據(jù)為核心的“生產(chǎn)、處理、質檢、管理、可視化分析”實景
    的頭像 發(fā)表于 11-06 10:26 ?966次閱讀

    基于深度學習三維分類方法

    近年來,云表示已成為計算機視覺領域的研究熱點之一,并廣泛應用于自動駕駛、虛擬現(xiàn)實、機器人等許多領域。雖然深度學習技術在處理常規(guī)結構化的二
    的頭像 發(fā)表于 10-29 09:43 ?1585次閱讀
    基于<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的<b class='flag-5'>三維</b><b class='flag-5'>點</b><b class='flag-5'>云</b>分類<b class='flag-5'>方法</b>

    什么是三維分割

    是世界的一種非結構化三維數(shù)據(jù)表示,通常由激光雷達傳感器、立體相機或深度傳感器采集。它由一系列單個組成,每個
    的頭像 發(fā)表于 10-29 09:21 ?657次閱讀

    三維觸摸面板-運用觸感功能

    。 醫(yī)療領域 : 醫(yī)療設備 :在醫(yī)療診斷設備、手術機器人等醫(yī)療設備中,三維觸摸面板可以用于操作和控制設備的各種功能。醫(yī)生可以通過觸摸和按壓面板來調整設備的參數(shù)、查看患者的信息等,提高醫(yī)療操作的準確性
    發(fā)表于 09-18 13:55

    友思特方案 基于三維實現(xiàn)PCB裝配螺絲視覺檢測

    三維是完成精密化 PCB 檢測的最新視覺技術。友思特 Saccde Vision 視覺掃描系統(tǒng),采用先進的三維成像技術和算法輸出直觀點云圖,進一步確保了PCB生產(chǎn)的可靠性與穩(wěn)定性能
    的頭像 發(fā)表于 08-28 16:35 ?640次閱讀
    友思特方案  基于<b class='flag-5'>三維</b><b class='flag-5'>點</b><b class='flag-5'>云</b>實現(xiàn)PCB裝配螺絲視覺檢測

    泰來三維 工廠三維掃描建模技術服務

    通過利用三維掃描技術建立工廠物體的三維模型,可以更加直觀地了解物體的形狀和尺寸信息,避免傳統(tǒng)測量方法的誤差和繁瑣操作,從而提高生產(chǎn)效率和質量。
    的頭像 發(fā)表于 07-22 13:14 ?714次閱讀
    泰來<b class='flag-5'>三維</b> 工廠<b class='flag-5'>三維</b>掃描建模技術服務