一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于DetNet的單階段單視圖三維點云重建網(wǎng)絡(luò)

冬至子 ? 來源:蘇大軌道交通學(xué)院研究生 ? 作者:Bin Li , Shiao Zhu an ? 2023-12-06 15:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. 文章摘要與主要貢獻(xiàn)

從一張圖片中推斷出具有合理形狀和外觀的物體是一個具有挑戰(zhàn)性的問題?,F(xiàn)有的研究往往更多地關(guān)注點云生成網(wǎng)絡(luò)的結(jié)構(gòu),而忽略了二維圖像的特征提取,減少了網(wǎng)絡(luò)中特征傳播過程中的損失。本文提出了一種單級單視圖三維點云重建網(wǎng)絡(luò)3D SSRecNet。所提出的3D SSRecNet是一個簡單的單級網(wǎng)絡(luò),由2D圖像特征提取網(wǎng)絡(luò)和點云預(yù)測網(wǎng)絡(luò)組成。單級網(wǎng)絡(luò)結(jié)構(gòu)可以減少提取的2D圖像特征的丟失。二維圖像特征提取網(wǎng)絡(luò)以DetNet為骨干。DetNet可以從2D圖像中提取更多細(xì)節(jié)。

為了生成形狀和外觀更好的點云,在點云預(yù)測網(wǎng)絡(luò)中,使用ELU作為激活函數(shù),并使用CD和EMD的聯(lián)合函數(shù)作為3D SSRecNet的損失函數(shù)。為了驗證3D SSRecNet的有效性,該文在ShapeNet和Pix3D數(shù)據(jù)集上進行了一系列實驗。CD和EMD測量的實驗結(jié)果表明,3D SSRecNet優(yōu)于最先進的重建方法。

該文工作的主要貢獻(xiàn)如下:

  1. 該文提出了一種用于從單個圖像進行3D重建的單階段神經(jīng)網(wǎng)絡(luò),即3D SSRecNet。3D SSRecNet將圖像作為輸入,并直接輸出預(yù)測的點云,而無需進一步處理。
  2. 3D SSRecNet包括特征提取和三維點云生成。特征提取網(wǎng)絡(luò)更善于提取2D輸入的詳細(xì)特征。點云生成網(wǎng)絡(luò)具有簡單的結(jié)構(gòu),并在其多層感知器中使用適當(dāng)?shù)募せ詈瘮?shù),這減少了轉(zhuǎn)發(fā)傳播過程中的特征損失,以獲得精細(xì)的輸出。
  3. 在ShapeNet和pix3D數(shù)據(jù)集上的實驗表明,3D SSRecNet在單視圖重建任務(wù)上優(yōu)于現(xiàn)有技術(shù)的重建方法。同時,該文還通過實驗證明了點云生成網(wǎng)絡(luò)激活函數(shù)的有效性。

**2. **研究方法

2.1 3D-SSRecNet的結(jié)構(gòu)

3D SSRecNet的體系結(jié)構(gòu)如圖1所示。3D SSRecNet包括兩個主要部分:二維圖像特征提取網(wǎng)絡(luò)和點云預(yù)測網(wǎng)絡(luò)。這兩個部分構(gòu)成了一個簡單的單階段點云重建網(wǎng)絡(luò)。單階段網(wǎng)絡(luò)結(jié)構(gòu)僅在3D SSRecNet的網(wǎng)絡(luò)內(nèi)傳輸2D圖片的特征。與需要跨網(wǎng)絡(luò)傳輸特征的兩階段重建網(wǎng)絡(luò)相比,這種網(wǎng)絡(luò)結(jié)構(gòu)減少了特征的損失。

圖片

圖 1 3D-SSRecNet框架—architecture of 3D-SSRecNet.

給定一個2D圖像,首先,該文通過DetNet獲得一個潛在的表示V。然后,該文通過全連接(FC)層將V映射到低維特征V’。然后直接應(yīng)用多層感知器(MLP)對點集進行預(yù)測。在訓(xùn)練過程中,計算倒角距離和推土機的距離損失函數(shù),并監(jiān)督可訓(xùn)練參數(shù)的更新。

2.2 二維圖像特征提取

許多圖像特征網(wǎng)絡(luò)應(yīng)用下采樣,帶來了更高的感受野,但不可避免地造成了圖像細(xì)節(jié)的損失。然而,對于重建,圖像細(xì)節(jié)對于幾何形狀的恢復(fù)至關(guān)重要。這種網(wǎng)絡(luò)更適合圖像分類任務(wù),但不適合需要更詳細(xì)特征的重建任務(wù)。

DetNet不僅保留了更多的細(xì)節(jié),而且保留了很大的感受野。盡管DetNet是為物體檢測而設(shè)計的,但其新穎的擴張瓶頸結(jié)構(gòu)提供了高分辨率的特征圖和大的感受野。該文使用DetNet作為圖像特征提取的主干。DetNet在階段4之前遵循與ResNet-50相同的結(jié)構(gòu),因此DetNet還具有易于訓(xùn)練且不會陷入梯度消失的優(yōu)點。表1顯示了DetNet最后兩個階段的參數(shù),即DetNet和ResNet-50之間的差異。

在第4階段之后,DetNet將特征圖的大小保持在16×16,這使得能夠保留更多細(xì)節(jié)。DetNet的第五和第六階段由具有擴張卷積的瓶頸組成,一些瓶頸在其快捷連接上具有1×1卷積。擴大的卷積增加了感受野。然而,考慮到計算量和存儲量,階段5和階段6設(shè)置相同的通道數(shù)256。在基線結(jié)束時,將應(yīng)用完全連接的圖層。

表 1 DetNet最后兩個階段的參數(shù)—the parameters of last two stages DetNet.

圖片

如圖1所示,在對輸入圖像進行特征提取后,該文獲得了輸入圖像的1000維潛在特征V。之后,全連接(FC)層將向量V的維度從1000壓縮到100,并獲得向量V’。

2.3 點云預(yù)測

該文使用三層MLP來直接預(yù)測點集。三個MLP層的輸出尺寸分別為512、1024和N×3。特征提取網(wǎng)絡(luò)的輸出:向量V'被饋送到點云預(yù)測網(wǎng)絡(luò)的MLP中。在前兩層上,引入ELU作為激活函數(shù)。

ELU激活函數(shù)及其導(dǎo)數(shù)的曲線分別如圖2a、b所示。對于常見的激活函數(shù),如ReLU,對應(yīng)于負(fù)軸的值為0。然而,標(biāo)準(zhǔn)化的點云坐標(biāo)間隔為[-1,1],這表明點云坐標(biāo)將具有負(fù)值。如圖2a所示,ELU激活函數(shù)的負(fù)軸對應(yīng)的值為非零。因此,使用ELU作為激活函數(shù),重建網(wǎng)絡(luò)中的負(fù)值信息在前向傳播過程中不會丟失。如圖3b所示,ELU的導(dǎo)數(shù)在負(fù)軸上也是非零的。在網(wǎng)絡(luò)的反向傳播過程中,負(fù)梯度不會丟失,它可以幫助更新網(wǎng)絡(luò)權(quán)重。

圖片

(a)激活函數(shù)ELU曲線 (b) ELU導(dǎo)數(shù)曲線

Curve of activation function ELU Curve of derivative of ELU

圖 2 ELU激活函數(shù)及其導(dǎo)數(shù)—ELU activation function and its derivative

圖片

圖 3 具有相同CD損失值的不同重建—different reconstructions with the same CD loss value

在實驗部分,該文證明了使用ELU作為激活函數(shù)的重建效果優(yōu)于使用其他激活函數(shù)。該文在最后一個激活層之后直接輸出預(yù)測的點集。它由tanh函數(shù)實現(xiàn),其輸出屬于[-1,1],與所需的點集數(shù)據(jù)相同。

2.4 損失函數(shù)

定義點云重建的損失函數(shù)。該文必須考慮兩個重要的性質(zhì)。(1)點云是一個無序的點集,因此無論該文如何改變點的順序,該文都將獲得相同的數(shù)據(jù)。(2)無論任何旋轉(zhuǎn)變換,真實物體的幾何特征均不得發(fā)生顯著變化。然而,例如,當(dāng)該文進行旋轉(zhuǎn)變換時,點坐標(biāo)似乎不同。

CD定義如下:

圖片

EMD定義如下:

圖片

綜合CD和EMD的優(yōu)缺點,該文的網(wǎng)絡(luò)的損失函數(shù)定義為:

圖片

3. 實驗過程 ****

該文分別在ShapeNet和Pix3D數(shù)據(jù)集上評估了所提出的3D SSRecNet。ShapeNet是一個紋理CAD模型的大集合,由13個類和43809個點云模型組成,用于訓(xùn)練和測試。該文使用80–20%的訓(xùn)練/測試分割來執(zhí)行該文的實驗。該文在Pix3D數(shù)據(jù)庫上進行了同樣的實驗。Pix3D數(shù)據(jù)庫由三個類和7595個點云模型組成。該數(shù)據(jù)集是真實場景的CAD模型。在Pix3D上的實驗可以更好地評估點云重建算法的實用性。

該文使用梯度優(yōu)化算法Adam來優(yōu)化所提出的3DSSRecNet。在訓(xùn)練中,該文將學(xué)習(xí)率設(shè)置為0.0005,將歷元設(shè)置為50。訓(xùn)練環(huán)境如下:Ubuntu 18.04.6,CUDA 10.1,GPU型號為NVIDIA Tesla T4×4。該文使用在1024個采樣點上計算的CD和EMD值來評估重建點云的質(zhì)量。

表 2 ShapeNet數(shù)據(jù)集上不同激活函數(shù)的重構(gòu)結(jié)果—reconstruction results of different activation functions on ShapeNet dataset.

圖片

表 3 CD評估的ShapeNet重建結(jié)果—reconstruction results on ShapeNet evaluated by CD

圖片

表 4 EMD評估的ShapeNet重建結(jié)果—reconstruction results on ShapeNet evaluated by EMD

圖片

**4. **文章結(jié)論

本文提出了一種高效的三維點云重建方法3DSSRecNet。給定圖像,它學(xué)習(xí)潛在的表示,在降維后,該文應(yīng)用MLP直接預(yù)測對應(yīng)點云。該文在ShapeNet和Pix3D數(shù)據(jù)集上進行了幾個實驗。該文證明了在發(fā)電網(wǎng)絡(luò)中使用激活函數(shù)ELU的重建效果優(yōu)于使用其他激活函數(shù)。也就是說,使用ELU生成的點云的CD和EMD值低于使用其他激活函數(shù)生成的點云中的CD和EMD值。

**5. **閱讀心得

這篇論文提出了一種名為3D-SSRecNet的單階段和單視圖3D點云重建網(wǎng)絡(luò),該網(wǎng)絡(luò)由2D圖像特征提取網(wǎng)絡(luò)和點云預(yù)測網(wǎng)絡(luò)組成。單階段網(wǎng)絡(luò)結(jié)構(gòu)可以減少提取的2D圖像特征的損失。2D圖像特征提取網(wǎng)絡(luò)采用DetNet作為骨干網(wǎng)絡(luò),可以從2D圖像中提取更多細(xì)節(jié)。為了生成形狀和外觀更好的點云,在點云預(yù)測網(wǎng)絡(luò)中,使用ELU作為激活函數(shù),并使用Chamfer距離(CD)和Earth mover’s distance(EMD)的聯(lián)合函數(shù)作為3D-SSRecNet的損失函數(shù)。在ShapeNet和Pix3D數(shù)據(jù)集上進行的實驗結(jié)果表明,通過CD和EMD測量,3D-SSRecNet優(yōu)于現(xiàn)有的重建方法。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103608
  • CAD
    CAD
    +關(guān)注

    關(guān)注

    18

    文章

    1114

    瀏覽量

    74315
  • EMD
    EMD
    +關(guān)注

    關(guān)注

    1

    文章

    43

    瀏覽量

    20342
  • 感知器
    +關(guān)注

    關(guān)注

    0

    文章

    34

    瀏覽量

    12005
  • MLP
    MLP
    +關(guān)注

    關(guān)注

    0

    文章

    57

    瀏覽量

    4618
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    怎樣去設(shè)計一種基于RGB-D相機的三維重建無序抓取系統(tǒng)?

    為什么要開發(fā)一種三維重建無序抓取系統(tǒng)?三維重建無序抓取系統(tǒng)是由哪些部分組成的?三維重建無序抓取系統(tǒng)有哪些關(guān)鍵技術(shù)和創(chuàng)新?
    發(fā)表于 07-02 06:29

    人工神經(jīng)網(wǎng)絡(luò)三維X線頭影測量系統(tǒng)中的應(yīng)用

    給出一種iX線頭影測量中圖形圖像重建的方法; 南正側(cè)位兩張X線頭影片上72個標(biāo)志??梢?b class='flag-5'>重建 顱頜骨三維
    發(fā)表于 07-07 14:24 ?19次下載

    AI+AR將用于智能三維重建領(lǐng)域

    AI與AR的關(guān)系日漸微妙,正在不斷融合、相互促進。在計算機視覺中, 三維重建是指根據(jù)視圖或者多視圖的二圖像
    發(fā)表于 09-21 10:33 ?4894次閱讀

    如何使用目視覺進行高精度三維場景重建技術(shù)研究

    近年來,隨著計算機硬件的不斷快速更新,計算機的處理能力也不斷變強。同時場景三維模型的獲取技術(shù)越來越成熟,我們獲得場景的三維模型數(shù)據(jù)的方式更多也更加方便了。而目前在基于目和雙目的三維重建
    發(fā)表于 12-24 15:55 ?7次下載
    如何使用<b class='flag-5'>單</b>目視覺進行高精度<b class='flag-5'>三維</b>場景<b class='flag-5'>重建</b>技術(shù)研究

    計算機視覺:三維數(shù)據(jù)處理學(xué)習(xí)內(nèi)容總結(jié)

    。三維匹配的目的就是把相鄰掃描的數(shù)據(jù)拼接在一起。三維匹配重點關(guān)注匹配算法,常用的算法有最近迭代算法 ICP和各種全局匹配算法。 2)多
    的頭像 發(fā)表于 11-27 10:32 ?5223次閱讀

    的概念以及與三維圖像的關(guān)系

    概念 三維圖像的關(guān)系:三維圖像是一種特殊的信息表達(dá)形式,其特征是表達(dá)的空間中
    的頭像 發(fā)表于 08-17 09:18 ?7879次閱讀
    <b class='flag-5'>點</b><b class='flag-5'>云</b>的概念以及與<b class='flag-5'>三維</b>圖像的關(guān)系

    NVIDIA Omniverse平臺助力三維重建服務(wù)協(xié)同發(fā)展

    計算機視覺的進步為元宇宙的數(shù)字孿生應(yīng)用打下堅實基礎(chǔ)。在計算機視覺中,三維重建是指根據(jù)視圖或者多視圖的圖像重建
    的頭像 發(fā)表于 10-13 09:45 ?1553次閱讀

    深度學(xué)習(xí)背景下的圖像三維重建技術(shù)進展綜述

    根據(jù)三維模型的表示形式可以將圖像三維重建方法分類為基于體素的三維重建、基于三維重建和基于網(wǎng)
    的頭像 發(fā)表于 01-09 14:26 ?3255次閱讀

    如何使用純格雷碼進行三維重建

    對于新手來說,使用格雷碼做目結(jié)構(gòu)光三維重建是一個入門級的訓(xùn)練。但是在復(fù)現(xiàn)時往往會遇到一個問題,明明解碼都很不錯了,重建后的精度卻很低,
    的頭像 發(fā)表于 01-13 11:41 ?1491次閱讀

    三維重建:從入門到入土

    經(jīng)典三維重建系統(tǒng)的整個pipeline從相機標(biāo)定、基礎(chǔ)矩陣與本質(zhì)矩陣估計、特征匹配到運動恢復(fù)結(jié)構(gòu)(SFM),從SFM到稠密重建、表面重建
    的頭像 發(fā)表于 03-03 10:17 ?1573次閱讀

    為什么三維視圖中不顯示PCB三維模型?

    PCB三維視圖中的三維主體模型顯示通過View Configuration Panel中的設(shè)置控制。我們將簡單介紹如何確保該選項被啟用。
    的頭像 發(fā)表于 04-28 15:48 ?7470次閱讀
    為什么<b class='flag-5'>三維</b><b class='flag-5'>視圖</b>中不顯示PCB<b class='flag-5'>三維</b>模型?

    三維計算視覺研究分析

    掃描。三維匹配的目的就是把相鄰掃描的數(shù)據(jù)拼接在一起。三維匹配重點關(guān)注匹配算法,常用的算法有最近迭代算法 ICP和各種全局匹配算法。 2
    的頭像 發(fā)表于 06-19 11:06 ?996次閱讀

    三維場景點理解與重建技術(shù)

    三維場景理解與重建技術(shù)主要包含場景點特征提取、掃描配準(zhǔn)與融合、場景理解與語義分割、掃描物體
    的頭像 發(fā)表于 08-08 16:58 ?1927次閱讀
    <b class='flag-5'>三維</b>場景點<b class='flag-5'>云</b>理解與<b class='flag-5'>重建</b>技術(shù)

    如何實現(xiàn)整個三維重建過程

    在計算機視覺中,三維重建是指根據(jù)視圖或者多視圖的圖像重建三維信息的過程。由于
    發(fā)表于 09-01 11:06 ?2128次閱讀
    如何實現(xiàn)整個<b class='flag-5'>三維重建</b>過程

    總結(jié)!三維基礎(chǔ)知識

    該方法具體通過六個步驟實現(xiàn):圖像的采集、系統(tǒng)相機標(biāo)定、特征模板匹配、圖像處理、三維仿真匹配以及三維重建。首先,通過兩個相機于不同位置對待測物體進行圖像信息感知獲取。然后根據(jù)角測量原理獲得待測表面的
    的頭像 發(fā)表于 09-01 16:12 ?2762次閱讀
    總結(jié)!<b class='flag-5'>三維</b><b class='flag-5'>點</b><b class='flag-5'>云</b>基礎(chǔ)知識