一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從多視角圖像做三維場(chǎng)景重建 (CVPR'22 Oral)

3D視覺(jué)工坊 ? 來(lái)源:3D視覺(jué)工坊 ? 2023-02-20 10:11 ? 次閱讀

我們介紹一篇2022 CVPR Oral的三維場(chǎng)景重建論文:Neural 3D Scene Reconstruction with the Manhattan-world Assumption,該論文由浙江大學(xué)CAD&CG國(guó)家重點(diǎn)實(shí)驗(yàn)室/浙大-商湯三維視覺(jué)聯(lián)合實(shí)驗(yàn)室提出。

9530d45c-b0aa-11ed-bfe3-dac502259ad0.jpg

論文鏈接:https://arxiv.org/abs/2205.02836

論文代碼:https://github.com/zju3dv/manhattan_sdf

Project page:https://zju3dv.github.io/manhattan_sdf/

1. 引言

1.1 論文的問(wèn)題描述

輸入在室內(nèi)場(chǎng)景采集的圖像序列,論文希望能生成該室內(nèi)場(chǎng)景的三維模型。該問(wèn)題有許多應(yīng)用,例如虛擬與增強(qiáng)現(xiàn)實(shí)、機(jī)器人等。

954a36b8-b0aa-11ed-bfe3-dac502259ad0.jpg

1.2 當(dāng)前方法在這個(gè)問(wèn)題的局限性

傳統(tǒng)方法一般通過(guò)MVS(Multi-View Stereo) [1,2] 做場(chǎng)景重建,首先根據(jù)多視角匹配來(lái)估計(jì)每個(gè)視角的深度圖,然后將每個(gè)視角的深度在三維空間中做融合。這類方法最大的問(wèn)題在于難以處理弱紋理區(qū)域、非朗伯表面,原因是這些區(qū)域難以做匹配,從而導(dǎo)致重建不完整。

9571595a-b0aa-11ed-bfe3-dac502259ad0.jpg

Multi-view Stereo via Depth Map Fusion: A Coordinate Decent Optimization Method

最近,有方法提出基于隱式神經(jīng)表示做三維重建。NeRF [3] 通過(guò)可微分的體積渲染技術(shù)從圖像中學(xué)習(xí)隱式輻射場(chǎng)。NeRF可以實(shí)現(xiàn)有真實(shí)感的視角合成,但是幾何重建結(jié)果噪音很嚴(yán)重,主要是因?yàn)槿狈Ρ砻婕s束。NeuS [4] 和 VolSDF [5] 使用有SDF(向距離場(chǎng))建模場(chǎng)景的幾何,并實(shí)現(xiàn)了基于SDF的體積渲染,可以得到相比于NeRF更加平滑的幾何重建結(jié)果。此類方法都是基于光度一致性原理,因而難以處理弱紋理區(qū)域,在室內(nèi)場(chǎng)景的重建質(zhì)量很差。

95928a62-b0aa-11ed-bfe3-dac502259ad0.jpg

NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

1.3 我們的觀察和對(duì)問(wèn)題的解決

為了克服室內(nèi)場(chǎng)景重建在弱紋理平面區(qū)域的歧義性,我們?cè)趦?yōu)化過(guò)程中基于曼哈頓假設(shè)采取了相應(yīng)的幾何約束。曼哈頓假設(shè)是一個(gè)被廣泛使用的室內(nèi)場(chǎng)景假設(shè),即室內(nèi)場(chǎng)景的地面、墻面、天花板通常被對(duì)齊在三個(gè)互相垂直的主方向,基于此我們對(duì)地面、墻面區(qū)域設(shè)計(jì)了對(duì)應(yīng)的幾何約束。

95a92268-b0aa-11ed-bfe3-dac502259ad0.jpg

曼哈頓假設(shè)示意圖

2. 論文方法

2.1 方法概述

論文使用神經(jīng)隱式表示建模場(chǎng)景的幾何、外觀和語(yǔ)義,并從多視角圖像優(yōu)化該表示。具體步驟為:

1)使用可微分體積渲染技術(shù),根據(jù)輸入圖像優(yōu)化幾何、外觀。

2)預(yù)測(cè)墻面、地面的語(yǔ)義分割,并基于曼哈頓假設(shè)對(duì)這些區(qū)域采用相應(yīng)的幾何約束。

3)為了提升對(duì)語(yǔ)義分割不準(zhǔn)確性的魯棒性,我們提出聯(lián)合優(yōu)化策略來(lái)同時(shí)優(yōu)化幾何和語(yǔ)義,從而實(shí)現(xiàn)更高質(zhì)量的重建結(jié)果。

95cd53f4-b0aa-11ed-bfe3-dac502259ad0.jpg

2.2 基于SDF的體積渲染

為了采用體積渲染技術(shù),我們首先將有向距離場(chǎng)轉(zhuǎn)換為體積密度:

95efec7a-b0aa-11ed-bfe3-dac502259ad0.png

2.3 幾何約束

我們首先使用DeepLabV3+ [6] 在圖像空間分割地面、墻面區(qū)域。對(duì)于地面區(qū)域的每個(gè)像素,我們首先做體積渲染得到對(duì)應(yīng)的表面點(diǎn),通過(guò)計(jì)算有向距離場(chǎng)在該處的梯度得到法向方向,設(shè)計(jì)損失函數(shù)約束其法向豎直向上:

961f2972-b0aa-11ed-bfe3-dac502259ad0.png

2.4 聯(lián)合優(yōu)化

幾何約束在語(yǔ)義分割準(zhǔn)確的區(qū)域可以起到很好的效果,但網(wǎng)絡(luò)預(yù)測(cè)的語(yǔ)義分割在部分區(qū)域可能是不準(zhǔn)確的,這會(huì)影響重建結(jié)果。如下圖所示,由于語(yǔ)義分割不準(zhǔn)確,導(dǎo)致加上幾何約束之后重建結(jié)果變得更加糟糕。

964333a8-b0aa-11ed-bfe3-dac502259ad0.jpg

為了克服這個(gè)問(wèn)題,我們?cè)?D空間中學(xué)習(xí)語(yǔ)義場(chǎng)。我們使用體積渲染技術(shù)將語(yǔ)義渲染到圖像空間,并通過(guò)softmax歸一化得到每個(gè)像素屬于地面、墻面區(qū)域的概率,我們利用這個(gè)概率來(lái)加權(quán)幾何約束:

?joint=∑?∈??^?(?)??(?)+∑?∈??^?(?)??(?)

同時(shí),為了避免trivial solution(屬于地面、墻面的概率被降為0),我們同時(shí)也用2D語(yǔ)義分割網(wǎng)絡(luò)的預(yù)測(cè)計(jì)算交叉熵作為監(jiān)督:

??=?∑?∈?∑?∈{?,?,?}??(?)log?^?(?)

3. 實(shí)驗(yàn)分析

3.1 Ablation studies

通過(guò)定性、定量的實(shí)驗(yàn)結(jié)果,我們發(fā)現(xiàn)使用體積約束能夠提升在平面區(qū)域的重建效果,但也會(huì)由于語(yǔ)義分割的不準(zhǔn)確性導(dǎo)致一些非平面區(qū)域的重建變差,通過(guò)使用我們提出的聯(lián)合優(yōu)化策略,可以全面地提升重建結(jié)果。

965d662e-b0aa-11ed-bfe3-dac502259ad0.jpg

968f27fe-b0aa-11ed-bfe3-dac502259ad0.jpg

3.2 與SOTA方法的對(duì)比

我們?cè)赟canNet和7-Scenes數(shù)據(jù)集上進(jìn)行了和之前MVS方法、基于volume rendering的方法的對(duì)比,數(shù)值結(jié)果大幅領(lǐng)先于之前的方法。

96b35e3a-b0aa-11ed-bfe3-dac502259ad0.jpg

96ddb432-b0aa-11ed-bfe3-dac502259ad0.jpg

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    212

    文章

    29280

    瀏覽量

    210920
  • 三維模型
    +關(guān)注

    關(guān)注

    0

    文章

    52

    瀏覽量

    13226

原文標(biāo)題:浙大提出Manhattan-SDF:從多視角圖像做三維場(chǎng)景重建 (CVPR'22 Oral)

文章出處:【微信號(hào):3D視覺(jué)工坊,微信公眾號(hào):3D視覺(jué)工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于安芯一號(hào)SLH89F5162的真三維立體圖形顯示

    相應(yīng)方位圖像的一種空間三維顯示,具有較高密度的視角間隔,視角數(shù)量,可供多人360度視場(chǎng)裸眼同時(shí)觀看,能自動(dòng)調(diào)節(jié)正確的水平和垂直視差。本項(xiàng)目
    發(fā)表于 10-19 15:16

    基于紋理映射的醫(yī)學(xué)圖像三維重建

    提出了一種基于紋理映射的體繪制算法,提高了圖像重建效率,增強(qiáng)了圖像重建效果。算法實(shí)現(xiàn)了對(duì)二醫(yī)學(xué)圖像
    發(fā)表于 12-14 11:10 ?19次下載

    基于FPGA的醫(yī)學(xué)圖像三維重建系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

    目前大部分的醫(yī)學(xué)圖像三維重建過(guò)程都是在PC機(jī)上完成的,由于PC機(jī)本身性能的限制和重建算法的復(fù)雜性,使得重建效率不高。針對(duì)這個(gè)問(wèn)題,設(shè)計(jì)與實(shí)現(xiàn)了一個(gè)基于FPGA(Field Progra
    發(fā)表于 03-15 13:52 ?44次下載

    AI+AR將用于智能三維重建領(lǐng)域

    AI與AR的關(guān)系日漸微妙,正在不斷融合、相互促進(jìn)。在計(jì)算機(jī)視覺(jué)中, 三維重建是指根據(jù)單視圖或者視圖的二圖像重建
    發(fā)表于 09-21 10:33 ?4766次閱讀

    如何使用單目視覺(jué)進(jìn)行高精度三維場(chǎng)景重建技術(shù)研究

    近年來(lái),隨著計(jì)算機(jī)硬件的不斷快速更新,計(jì)算機(jī)的處理能力也不斷變強(qiáng)。同時(shí)場(chǎng)景三維模型的獲取技術(shù)越來(lái)越成熟,我們獲得場(chǎng)景三維模型數(shù)據(jù)的方式更多也更加方便了。而目前在基于單目和雙目的
    發(fā)表于 12-24 15:55 ?7次下載
    如何使用單目視覺(jué)進(jìn)行高精度<b class='flag-5'>三維</b><b class='flag-5'>場(chǎng)景</b><b class='flag-5'>重建</b>技術(shù)研究

    無(wú)人機(jī)圖像處理技術(shù)之三維還原重建技術(shù)簡(jiǎn)介

    無(wú)人機(jī)圖像處理技術(shù)精髓匯總 (一) 三維還原重建技術(shù)簡(jiǎn)介 demi 在 周一, 04/01/2019 - 11:30 提交 航拍是無(wú)人機(jī)在實(shí)際場(chǎng)景中的重要應(yīng)用。本系列文章將簡(jiǎn)單介紹無(wú)人
    發(fā)表于 03-24 16:24 ?7449次閱讀

    透明物體的三維重建研究綜述

    透明物體的三維重建一直以來(lái)都被認(rèn)為是很有挑戰(zhàn)性的問(wèn)題。不同于傳統(tǒng)重建算法對(duì)物體表面的漫反射屬性假設(shè),因?yàn)橥该魑矬w與光線之間存在復(fù)雜的,如反射和折射等,與視角相關(guān)的光學(xué)效應(yīng),將導(dǎo)致傳統(tǒng)重建
    發(fā)表于 04-21 14:21 ?4次下載
    透明物體的<b class='flag-5'>三維重建</b>研究綜述

    基于視角圖片的高精度三維人臉重建綜述

    提岀了一種多階段優(yōu)化的方法來(lái)解決基于視角圖片在未知姿態(tài)、表情以及光照條件下的高精度三維人臉重建問(wèn)題。首先,通過(guò)重新渲染合成的方法將參數(shù)化模型擬合到輸入的
    發(fā)表于 06-07 14:27 ?5次下載

    三維CT層間圖像超分辨率重建與修復(fù)綜述

    三維CT層間圖像超分辨率重建與修復(fù)綜述
    發(fā)表于 06-27 10:56 ?25次下載

    NVIDIA Omniverse平臺(tái)助力三維重建服務(wù)協(xié)同發(fā)展

    計(jì)算機(jī)視覺(jué)的進(jìn)步為元宇宙的數(shù)字孿生應(yīng)用打下堅(jiān)實(shí)基礎(chǔ)。在計(jì)算機(jī)視覺(jué)中,三維重建是指根據(jù)單視圖或者視圖的圖像重建三維信息的過(guò)程。數(shù)字孿生開(kāi)發(fā)者
    的頭像 發(fā)表于 10-13 09:45 ?1379次閱讀

    深度學(xué)習(xí)背景下的圖像三維重建技術(shù)進(jìn)展綜述

    根據(jù)三維模型的表示形式可以將圖像三維重建方法分類為基于體素的三維重建、基于點(diǎn)云的三維重建和基于網(wǎng)格的三維
    的頭像 發(fā)表于 01-09 14:26 ?3076次閱讀

    NerfingMVS:引導(dǎo)優(yōu)化神經(jīng)輻射場(chǎng)實(shí)現(xiàn)室內(nèi)視角三維重建

    既然Nerf可以表示場(chǎng)景三維信息,一個(gè)自然的想法是能不能將NeRF應(yīng)用到室內(nèi)場(chǎng)景三維重建任務(wù)中呢。NeRF有著一些優(yōu)勢(shì):相較于傳統(tǒng)的MVS,SfM算法,NeRF蘊(yùn)含了整個(gè)
    的頭像 發(fā)表于 02-13 11:20 ?3491次閱讀

    三維重建入門到入土

    經(jīng)典三維重建系統(tǒng)的整個(gè)pipeline相機(jī)標(biāo)定、基礎(chǔ)矩陣與本質(zhì)矩陣估計(jì)、特征匹配到運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)(SFM),SFM到稠密點(diǎn)云重建、表面重建
    的頭像 發(fā)表于 03-03 10:17 ?1435次閱讀

    三維場(chǎng)景點(diǎn)云理解與重建技術(shù)

    三維場(chǎng)景理解與重建技術(shù)主要包含場(chǎng)景點(diǎn)云特征提取、掃描點(diǎn)云配準(zhǔn)與融合、場(chǎng)景理解與語(yǔ)義分割、掃描物體點(diǎn)云補(bǔ)全與細(xì)粒度
    的頭像 發(fā)表于 08-08 16:58 ?1730次閱讀
    <b class='flag-5'>三維</b><b class='flag-5'>場(chǎng)景</b>點(diǎn)云理解與<b class='flag-5'>重建</b>技術(shù)

    如何實(shí)現(xiàn)整個(gè)三維重建過(guò)程

    在計(jì)算機(jī)視覺(jué)中,三維重建是指根據(jù)單視圖或者視圖的圖像重建三維信息的過(guò)程。由于單視頻的信息不完全,因此
    發(fā)表于 09-01 11:06 ?1995次閱讀
    如何實(shí)現(xiàn)整個(gè)<b class='flag-5'>三維重建</b>過(guò)程