一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PatchMatch MVS求解器中深度估計(jì)的挑戰(zhàn)性問(wèn)題

3D視覺(jué)工坊 ? 來(lái)源:3D視覺(jué)工坊 ? 2024-01-02 09:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文介紹了一種可學(xué)習(xí)的變形假設(shè)采樣器(DeformSampler),用于解決精確PatchMatch多視圖立體(MVS)中嘈雜深度估計(jì)的挑戰(zhàn)性問(wèn)題。我們觀察到PatchMatch MVS求解器所采用的啟發(fā)式深度假設(shè)采樣模式對(duì)以下兩個(gè)方面不敏感:(i)物體表面深度的分段平滑分布,(ii)沿著表面點(diǎn)射線(xiàn)方向的深度預(yù)測(cè)概率的隱式多模態(tài)分布。因此,作者開(kāi)發(fā)了DeformSampler,以學(xué)習(xí)對(duì)分布敏感的樣本空間,以便(i)沿著物體表面?zhèn)鞑ヅc場(chǎng)景幾何一致的深度,(ii)擬合逼近實(shí)際深度沿射線(xiàn)方向的點(diǎn)級(jí)概率分布的拉普拉斯混合模型。作者將DeformSampler集成到可學(xué)習(xí)的PatchMatch MVS系統(tǒng)中,以提高在挑戰(zhàn)性區(qū)域(如分段不連續(xù)的表面邊界和紋理較弱的區(qū)域)的深度估計(jì)能力。在DTU和Tanks&Temples數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,與最先進(jìn)的競(jìng)爭(zhēng)對(duì)手相比,其表現(xiàn)優(yōu)越且具有很好的泛化能力。

讀者理解:

該方法的主要貢獻(xiàn)是提出了一種可學(xué)習(xí)的變形假設(shè)采樣器(DeformSampler),用于解決多視圖立體匹配(PatchMatch MVS)中噪聲深度估計(jì)的挑戰(zhàn)問(wèn)題。DeformSampler 通過(guò)學(xué)習(xí)分布敏感的樣本空間,能夠傳播與場(chǎng)景幾何一致的深度,并擬合逼近實(shí)際深度分布的拉普拉斯混合模型。

實(shí)驗(yàn)結(jié)果表明,該方法在 ETH3D 數(shù)據(jù)集上表現(xiàn)優(yōu)異,甚至超過(guò)了其他最新的基于學(xué)習(xí)的 MVS 模型。

具體來(lái)說(shuō),該方法的創(chuàng)新點(diǎn)包括:

提出了一種可學(xué)習(xí)的變形假設(shè)采樣器(DeformSampler),用于解決多視圖立體匹配(PatchMatch MVS)中噪聲深度估計(jì)的挑戰(zhàn)問(wèn)題。通過(guò)學(xué)習(xí)分布敏感的樣本空間,DeformSampler 能夠傳播與場(chǎng)景幾何一致的深度,并擬合逼近實(shí)際深度分布的拉普拉斯混合模型。

實(shí)驗(yàn)結(jié)果表明,該方法在 ETH3D 數(shù)據(jù)集上表現(xiàn)優(yōu)異,甚至超過(guò)了其他最新的基于學(xué)習(xí)的 MVS 模型。

1 引言

這篇論文主要解決了多視圖立體(MVS)中深度估計(jì)的挑戰(zhàn)性問(wèn)題。傳統(tǒng)方法在低紋理、鏡面和反射區(qū)域內(nèi)的匹配困難,學(xué)習(xí)型方法引入全局語(yǔ)義信息以提高魯棒性,但準(zhǔn)確性與效率之間存在差距。學(xué)習(xí)型方法通常構(gòu)建3D成本體,利用3D CNN進(jìn)行深度回歸。然而,資源有限限制了這些方法的成本體和CNN的3D形式。

為了解決這些限制,研究致力于減少成本體大小和修改正則化技術(shù)。近期出現(xiàn)的一種有前景的解決方案將傳統(tǒng)的PatchMatch MVS轉(zhuǎn)化為端到端框架,但這些方法未充分考慮場(chǎng)景內(nèi)隱含的深度分布,導(dǎo)致深度估計(jì)性能下降。

因此,論文提出了DeformSampler,一種可學(xué)習(xí)的變形假設(shè)采樣器,用于在學(xué)習(xí)型PatchMatch框架中學(xué)習(xí)隱含深度分布,指導(dǎo)可變形的假設(shè)采樣。DeformSampler在傳播和擾動(dòng)階段支持每個(gè)像素進(jìn)行最優(yōu)假設(shè)采樣。通過(guò)平面指示器捕捉分段平滑深度分布,以實(shí)現(xiàn)結(jié)構(gòu)感知的深度傳播,并利用概率匹配器對(duì)深度預(yù)測(cè)概率的多模態(tài)分布進(jìn)行建模,實(shí)現(xiàn)不確定性感知的擾動(dòng)。集成DeformSampler到學(xué)習(xí)型PatchMatch框架中,能在具有挑戰(zhàn)性的分段不連續(xù)表面邊界和紋理較弱區(qū)域獲得優(yōu)秀的深度估計(jì)性能,并展現(xiàn)出在室外和室內(nèi)場(chǎng)景中的強(qiáng)大泛化能力。

7af2c412-a8fa-11ee-8b88-92fbcf53809c.png

7b13d166-a8fa-11ee-8b88-92fbcf53809c.png

2 方法

本文提出了一種全新的學(xué)習(xí)型PatchMatch MVS框架,DS-PMNet,并嵌入了DeformSampler。這個(gè)框架能夠以端到端的方式學(xué)習(xí)隱含深度分布,指導(dǎo)可變形的深度采樣。論文總體框架在圖2中展示,主要包括四個(gè)階段的優(yōu)化:初始化、傳播、評(píng)估和擾動(dòng)。其中,傳播階段通過(guò)平面指示器Pθ捕捉物體表面的分段平滑深度分布,指導(dǎo)結(jié)構(gòu)感知的假設(shè)傳播;而擾動(dòng)階段則利用概率匹配器Mθ模擬深度預(yù)測(cè)概率的多模態(tài)分布,指導(dǎo)不確定性感知的擾動(dòng)。

具體實(shí)現(xiàn)中,DS-PMNet通過(guò)特征金字塔Ψ提取了不同尺度的特征,用于深度估計(jì)。在階段I中,隨機(jī)初始化參考圖像的深度圖。在階段II,平面指示器Pθ利用自相似性特征編碼,指導(dǎo)結(jié)構(gòu)感知的假設(shè)傳播,生成可靠的假設(shè)集合。在階段III,概率匹配器Mθ模擬了深度預(yù)測(cè)概率的分布,輸出不確定性,指導(dǎo)下一步的擾動(dòng)。階段IV則利用推斷出的混合分布來(lái)引導(dǎo)擾動(dòng),進(jìn)一步優(yōu)化深度估計(jì)。這個(gè)框架能夠提高深度估計(jì)性能,在圖像特征和深度估計(jì)中起到關(guān)鍵作用。

此外,文中提到的平面指示器Pθ由兩部分組成:內(nèi)視圖相關(guān)金字塔和平面流解碼器。內(nèi)視圖相關(guān)金字塔利用卷積運(yùn)算計(jì)算特征之間的相關(guān)性,而平面流解碼器則逐漸推斷出平面流場(chǎng)。概率匹配器Mθ則基于多視圖成本金字塔,預(yù)測(cè)深度估計(jì)概率的分布參數(shù),進(jìn)一步提高深度估計(jì)的準(zhǔn)確性。

最后,論文采用了負(fù)對(duì)數(shù)似然損失函數(shù)作為監(jiān)督,用于監(jiān)督深度估計(jì)的擬合混合拉普拉斯分布,進(jìn)一步優(yōu)化模型??偟膩?lái)說(shuō),DS-PMNet框架通過(guò)DeformSampler的引導(dǎo),能夠提升MVS中的深度估計(jì)性能,對(duì)于深度估計(jì)及場(chǎng)景特征提取有著重要的作用。

7b2828fa-a8fa-11ee-8b88-92fbcf53809c.png

7b590fa6-a8fa-11ee-8b88-92fbcf53809c.png

3 總結(jié)

本文提出了一種可學(xué)習(xí)的DeformSampler,嵌入到PatchMatch MVS框架中,有助于在復(fù)雜場(chǎng)景中實(shí)現(xiàn)準(zhǔn)確的深度估計(jì)。所提出的DeformSampler能夠在傳播和擾動(dòng)過(guò)程中,幫助采樣對(duì)分布敏感的假設(shè)空間。在多個(gè)具有挑戰(zhàn)性的MVS數(shù)據(jù)集上進(jìn)行了廣泛實(shí)驗(yàn),結(jié)果顯示DeformSampler能夠有效學(xué)習(xí)物體表面的分段平滑深度分布,可靠地傳播深度,并成功捕捉深度預(yù)測(cè)概率的多模態(tài)分布,從而實(shí)現(xiàn)精細(xì)化的假設(shè)采樣。與現(xiàn)有方法的比較也表明,我們的方法在MVS基準(zhǔn)測(cè)試上能夠達(dá)到最先進(jìn)的性能水平。

7b6f55ea-a8fa-11ee-8b88-92fbcf53809c.png

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4381

    瀏覽量

    64924
  • 圖像特征
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    7106
  • 采樣器
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    2674

原文標(biāo)題:讀者理解:

文章出處:【微信號(hào):3D視覺(jué)工坊,微信公眾號(hào):3D視覺(jué)工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    大模型推理顯存和計(jì)算量估計(jì)方法研究

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)大模型在各個(gè)領(lǐng)域得到了廣泛應(yīng)用。然而,大模型的推理過(guò)程對(duì)顯存和計(jì)算資源的需求較高,給實(shí)際應(yīng)用帶來(lái)了挑戰(zhàn)。為了解決這一問(wèn)題,本文將探討大模型推理顯存和計(jì)算量的估計(jì)
    發(fā)表于 07-03 19:43

    音頻設(shè)計(jì):比你所想象的更富挑戰(zhàn)性

    音頻設(shè)計(jì):比你所想象的更富挑戰(zhàn)性 通常會(huì)認(rèn)為20 Hz ~20 kHz常規(guī)頻段的音頻設(shè)計(jì)是基本的、不具挑戰(zhàn)性的。但是本篇特別報(bào)道的作者----音頻工程(audio engineering)的專(zhuān)家們對(duì)
    發(fā)表于 09-16 10:02 ?889次閱讀

    當(dāng)前智能機(jī)器人發(fā)展若干挑戰(zhàn)性問(wèn)題

    在本專(zhuān)場(chǎng),北京航空航天大學(xué)教授、北京航空航天大學(xué)機(jī)器人研究所名譽(yù)所長(zhǎng)、長(zhǎng)江學(xué)者特聘教授王田苗教授率先登場(chǎng),為本專(zhuān)場(chǎng)做了題為“當(dāng)前智能機(jī)器人發(fā)展若干挑戰(zhàn)性問(wèn)題”的大會(huì)報(bào)告。
    的頭像 發(fā)表于 07-09 10:44 ?5623次閱讀

    便攜式醫(yī)療系統(tǒng)無(wú)線(xiàn)監(jiān)控的挑戰(zhàn)性要求

    本文探討了便攜式醫(yī)療系統(tǒng)無(wú)線(xiàn)監(jiān)控的挑戰(zhàn)性要求。在設(shè)計(jì)高可靠性醫(yī)療設(shè)備時(shí)需要權(quán)衡各種工程環(huán)節(jié),從超低功耗收發(fā)和各種協(xié)議,到高效電源管理和傳感接口。
    的頭像 發(fā)表于 09-28 17:01 ?2520次閱讀
    便攜式醫(yī)療系統(tǒng)<b class='flag-5'>中</b>無(wú)線(xiàn)監(jiān)控的<b class='flag-5'>挑戰(zhàn)性</b>要求

    Facebook為挑戰(zhàn)性環(huán)境優(yōu)化6DoF控制追蹤

    Facebook進(jìn)一步介紹關(guān)于最近用以?xún)?yōu)化控制追蹤性能的版本更新,尤其是針對(duì)具有挑戰(zhàn)性的追蹤環(huán)境,如包含圣誕樹(shù)或假日裝飾燈具的空間。
    發(fā)表于 07-25 10:27 ?853次閱讀

    基于多孔卷積神經(jīng)網(wǎng)絡(luò)的圖像深度估計(jì)模型

    針對(duì)在傳統(tǒng)機(jī)器學(xué)習(xí)方法下單幅圖像深度估計(jì)效果差、深度值獲取不準(zhǔn)確的問(wèn)題,提出了一種基于多孔卷積神經(jīng)網(wǎng)絡(luò)(ACNN)的深度估計(jì)模型。首先,利用
    發(fā)表于 09-29 16:20 ?5次下載
    基于多孔卷積神經(jīng)網(wǎng)絡(luò)的圖像<b class='flag-5'>深度</b><b class='flag-5'>估計(jì)</b>模型

    針對(duì)系統(tǒng)提供商最具挑戰(zhàn)性需求的自定義模塊

    針對(duì)系統(tǒng)提供商最具挑戰(zhàn)性需求的自定義模塊
    發(fā)表于 04-26 16:15 ?4次下載
    針對(duì)系統(tǒng)提供商最具<b class='flag-5'>挑戰(zhàn)性</b>需求的自定義模塊

    深度神經(jīng)網(wǎng)絡(luò)的基本理論和架構(gòu)

    隨著數(shù)學(xué)優(yōu)化和計(jì)算硬件的迅猛發(fā)展,深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNN)(名詞解釋>)已然成為解決各領(lǐng)域中許多挑戰(zhàn)性問(wèn)題的強(qiáng)大工具,包括決策、計(jì)算成像、全息技術(shù)等。
    的頭像 發(fā)表于 04-11 12:24 ?4187次閱讀

    介紹第一個(gè)結(jié)合相對(duì)和絕對(duì)深度的多模態(tài)單目深度估計(jì)網(wǎng)絡(luò)

    單目深度估計(jì)分為兩個(gè)派系,metric depth estimation(度量深度估計(jì),也稱(chēng)絕對(duì)深度估計(jì)
    的頭像 發(fā)表于 03-21 18:01 ?7584次閱讀

    深度學(xué)習(xí)在語(yǔ)音識(shí)別的應(yīng)用及挑戰(zhàn)

    挑戰(zhàn)。 二、深度學(xué)習(xí)在語(yǔ)音識(shí)別的應(yīng)用 1.基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別:深度神經(jīng)網(wǎng)絡(luò)(DNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是
    的頭像 發(fā)表于 10-10 18:14 ?1247次閱讀

    一種利用幾何信息的自監(jiān)督單目深度估計(jì)框架

    本文方法是一種自監(jiān)督的單目深度估計(jì)框架,名為GasMono,專(zhuān)門(mén)設(shè)計(jì)用于室內(nèi)場(chǎng)景。本方法通過(guò)應(yīng)用多視圖幾何的方式解決了室內(nèi)場(chǎng)景幀間大旋轉(zhuǎn)和低紋理導(dǎo)致自監(jiān)督深度
    發(fā)表于 11-06 11:47 ?727次閱讀
    一種利用幾何信息的自監(jiān)督單目<b class='flag-5'>深度</b><b class='flag-5'>估計(jì)</b>框架

    單目深度估計(jì)開(kāi)源方案分享

    可以看一下單目深度估計(jì)效果,這個(gè)深度圖的分辨率是真的高,物體邊界分割的非常干凈!這里也推薦工坊推出的新課程《單目深度估計(jì)方法:算法梳理與代碼
    的頭像 發(fā)表于 12-17 10:01 ?1189次閱讀
    單目<b class='flag-5'>深度</b><b class='flag-5'>估計(jì)</b>開(kāi)源方案分享

    康謀分享 | 在基于場(chǎng)景的AD/ADAS驗(yàn)證過(guò)程,識(shí)別挑戰(zhàn)性場(chǎng)景!

    基于場(chǎng)景的驗(yàn)證是AD/ADAS系統(tǒng)開(kāi)發(fā)過(guò)程的重要步驟,然而面對(duì)海量駕駛記錄數(shù)據(jù)時(shí),如何實(shí)現(xiàn)自動(dòng)且高效地識(shí)別、分類(lèi)和提取駕駛記錄挑戰(zhàn)性場(chǎng)景?本文康謀為您介紹IVEX軟件識(shí)別挑戰(zhàn)性場(chǎng)
    的頭像 發(fā)表于 08-28 10:16 ?1428次閱讀
    康謀分享 | 在基于場(chǎng)景的AD/ADAS驗(yàn)證過(guò)程<b class='flag-5'>中</b>,識(shí)別<b class='flag-5'>挑戰(zhàn)性</b>場(chǎng)景!

    建筑物邊緣感知和邊緣融合的多視圖立體三維重建方法

    航空建筑深度估計(jì)是三維數(shù)字城市重建中的一項(xiàng)重要任務(wù),基于深度學(xué)習(xí)的多視圖立體(MVS)方法在該領(lǐng)域取得了較好的成果。目前的主要方法通過(guò)修改MVS
    的頭像 發(fā)表于 11-07 10:16 ?939次閱讀
    建筑物邊緣感知和邊緣融合的多視圖立體三維重建方法

    【AIBOX 應(yīng)用案例】單目深度估計(jì)

    ?Firefly所推出的NVIDIA系列的AIBOX可實(shí)現(xiàn)深度估計(jì),該技術(shù)是一種從單張或者多張圖像預(yù)測(cè)場(chǎng)景深度信息的技術(shù),廣泛應(yīng)用于計(jì)算機(jī)視覺(jué)領(lǐng)域,尤其是在三維重建、場(chǎng)景理解和環(huán)境感知等任務(wù)
    的頭像 發(fā)表于 03-19 16:33 ?426次閱讀
    【AIBOX 應(yīng)用案例】單目<b class='flag-5'>深度</b><b class='flag-5'>估計(jì)</b>