一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TUM&谷歌提出md4all:挑戰(zhàn)性條件下的單目深度估計

CVer ? 來源:CVer ? 2023-09-04 16:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

大家好, 我叫Stefano Gasperini, 在此宣傳我們的ICCV 2023的工作, 更多詳細信息可查看我們的論文: https://arxiv.org/abs/2308.09711, 和我們的項目網(wǎng)站: https://md4all.github.io.

代碼:https://github.com/md4all/md4all

在CVer微信公眾號后臺回復(fù):md4all,可下載本論文pdf和代碼

首先請大家觀看這樣一個例子:

你能在彩色圖片中看到樹嗎?

942f969e-49aa-11ee-97a6-92fbcf53809c.png

我們的單目深度估計網(wǎng)絡(luò)在所有條件下都能輸出可靠的深度估計值,即使在黑暗中也是如此!

背景

雖然最先進的單目深度估計方法在理想環(huán)境下取得了令人印象深刻的結(jié)果,但在具有挑戰(zhàn)性的光照和天氣條件下,如夜間或下雨天,這些方法卻非常不可靠。

94a1f568-49aa-11ee-97a6-92fbcf53809c.png

在這些情況下, 傳感器自帶的噪聲、無紋理的黑暗區(qū)域和反光等不利因素都違反了基于監(jiān)督和自監(jiān)督學(xué)習(xí)方法的訓(xùn)練假設(shè)。自監(jiān)督方法無法建立學(xué)習(xí)深度所需的像素的對應(yīng)關(guān)系,而監(jiān)督方法則可能從傳感器真值中(如上圖中的 LiDAR 與 nuScenes 的數(shù)據(jù)樣本)中學(xué)習(xí)到數(shù)據(jù)瑕疵。

方法

在本文中,我們提出了 md4all 解決了這些安全關(guān)鍵問題。md4all 是一個簡單有效的解決方案,在不利和理想條件下都能可靠運行,而且適用于不同類型的監(jiān)督學(xué)習(xí)。

952a5ae8-49aa-11ee-97a6-92fbcf53809c.png

我們利用現(xiàn)有方法在完美設(shè)置下的工作能力來實現(xiàn)這一目標(biāo)。因此,我們提供的有效訓(xùn)練信號與輸入信號無關(guān)。首先,通過圖像轉(zhuǎn)換,我們生成一組與正常訓(xùn)練樣本相對應(yīng)的復(fù)雜樣本。然后,我們通過輸入生成的樣本并計算相應(yīng)原始圖像上的標(biāo)準(zhǔn)損失,引導(dǎo)網(wǎng)絡(luò)模型進行自監(jiān)督學(xué)習(xí)或完全監(jiān)督學(xué)習(xí)。

如上圖所示,我們進一步從預(yù)先訓(xùn)練好的基線模型中提煉知識,該模型只在理想環(huán)境下進行推理,同時向深度模型提供理想和不利的混合輸入。

我們的 GitHub 代碼庫中包含所提方法的實現(xiàn)代碼, 歡迎訪問:

https://github.com/md4all/md4all

結(jié)果

95729150-49aa-11ee-97a6-92fbcf53809c.png

通過 md4all,我們大大超越了之前的解決方案,在各種條件下都能提供穩(wěn)健的估計。值得注意的是,所提出的 md4all 只使用了一個單目模型,沒有專門的分支。

上圖顯示了在 nuScenes 數(shù)據(jù)集的挑戰(zhàn)性環(huán)境下的預(yù)測結(jié)果。由于場景的黑暗程度和噪聲帶來的影響,自監(jiān)督方法 Monodepth2 無法提取有價值的特征(第一行)。有監(jiān)督的 AdaBins 會學(xué)習(xí)到來自傳感器數(shù)據(jù)的瑕疵,并造成道路上的空洞預(yù)測現(xiàn)象(第二行)。在相同的架構(gòu)上應(yīng)用,我們的 md4all 提高了在標(biāo)準(zhǔn)和不利條件下的魯棒性。

95b86dd8-49aa-11ee-97a6-92fbcf53809c.png

95e37988-49aa-11ee-97a6-92fbcf53809c.png

在本文中,我們展示了 md4all 在標(biāo)準(zhǔn)和不利條件下兩種類型的監(jiān)督下的有效性。通過在 nuScenes 和 Oxford RobotCar 數(shù)據(jù)集上的大量實驗,md4all 的表現(xiàn)明顯優(yōu)于之前的作品(如上圖數(shù)據(jù)所示)。

圖像轉(zhuǎn)換

960717bc-49aa-11ee-97a6-92fbcf53809c.png

我們還顯示了為訓(xùn)練 md4all 而生成的圖像轉(zhuǎn)換示例 (如上圖所示)。我們通過向模型提供原始樣本和轉(zhuǎn)換樣本的混合數(shù)據(jù)進行數(shù)據(jù)增強。這樣一個模型就能在不同條件下恢復(fù)信息,而無需在推理時進行修改。

在此,我們開源共享所有不利條件下生成的圖像,這些圖像與 nuScenes 和牛津 Robotcar 訓(xùn)練集中的晴天和陰天樣本相對應(yīng)。歡迎訪問:

https://forms.gle/31w2TvtTiVNyPb916

這些圖像可用于未來深度估計或其他任務(wù)的穩(wěn)健方法。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2566

    文章

    53008

    瀏覽量

    767494
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    108147
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50427

原文標(biāo)題:ICCV 2023 | TUM&谷歌提出md4all:挑戰(zhàn)性條件下的單目深度估計

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    特定溫度條件下的應(yīng)變測量方案

    變測量的準(zhǔn)確。因此,用電阻應(yīng)變計測量高溫或低溫條件下的應(yīng)變時,其精度比常溫條件下差。<br/>&
    發(fā)表于 05-04 17:45

    如何在芯片內(nèi)同時捕獲不同觸發(fā)條件下的信號

    的64 MB時,在少數(shù)地址位置缺少數(shù)據(jù),因此要檢查為什么這些字丟失,我需要查看不同地址位置的少量信號的狀態(tài)。由于芯片的深度不能捕獲完整的數(shù)據(jù),我想在芯片內(nèi)同時捕獲不同觸發(fā)條件下的信號。如果沒有
    發(fā)表于 03-15 14:28

    基于深度估計的紅外圖像彩色化方法_戈曼

    基于深度估計的紅外圖像彩色化方法_戈曼
    發(fā)表于 03-17 10:13 ?0次下載

    深度負反饋條件下的近似計算

    本文介紹了深度負反饋條件下的近似計算。
    發(fā)表于 11-22 19:15 ?12次下載
    <b class='flag-5'>深度</b>負反饋<b class='flag-5'>條件下</b>的近似計算

    基于圖像的深度估計算法,大幅度提升基于圖像深度估計的精度

    雙目匹配需要把左圖像素和右圖中其對應(yīng)像素進行匹配,再由匹配的像素差算出左圖像素對應(yīng)的深度,而之前的深度估計方法均不能顯式引入類似的幾何約
    的頭像 發(fā)表于 06-04 15:46 ?3.6w次閱讀
    基于<b class='flag-5'>單</b><b class='flag-5'>目</b>圖像的<b class='flag-5'>深度</b><b class='flag-5'>估計</b>算法,大幅度提升基于<b class='flag-5'>單</b><b class='flag-5'>目</b>圖像<b class='flag-5'>深度</b><b class='flag-5'>估計</b>的精度

    采用自監(jiān)督CNN進行圖像深度估計的方法

    為了提高利用深度神經(jīng)網(wǎng)絡(luò)預(yù)測圖像深度信息的精確度,提出了一種采用自監(jiān)督卷積神經(jīng)網(wǎng)絡(luò)進行圖像深度
    發(fā)表于 04-27 16:06 ?13次下載
    采用自監(jiān)督CNN進行<b class='flag-5'>單</b>圖像<b class='flag-5'>深度</b><b class='flag-5'>估計</b>的方法

    歐拉 Summit 2021 安全&amp;amp;可靠&amp;amp;運維專場:主流備份技術(shù)探討

    在openEuler Summit 2021 安全&amp;可靠&amp;運維專場上,高沖對為數(shù)據(jù)安全而生,統(tǒng)信軟件備份還原工具分享。
    的頭像 發(fā)表于 11-10 17:42 ?2053次閱讀
    歐拉 Summit 2021 安全&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;可靠<b class='flag-5'>性</b>&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;運維專場:主流備份技術(shù)探討

    滿足當(dāng)今外殼設(shè)計具有挑戰(zhàn)性的性能和散熱要求

      國防和航空航天加固型系統(tǒng)市場需要在極端環(huán)境條件下提供廣泛的計算能力??傮w而言,應(yīng)用程序需要更多的處理能力;不可避免的是,隨著處理能力的增長,熱管理變得越來越具有挑戰(zhàn)性。
    的頭像 發(fā)表于 10-28 11:16 ?968次閱讀

    密集SLAM的概率體積融合概述

    我們提出了一種利用深度密集 SLAM 和快速不確定性傳播從圖像重建 3D 場景的新方法。所提出的方法能夠密集、準(zhǔn)確、實時地 3D 重建場
    的頭像 發(fā)表于 01-30 11:34 ?935次閱讀

    一種用于自監(jiān)督深度估計的輕量級CNN和Transformer架構(gòu)

    自監(jiān)督深度估計不需要地面實況訓(xùn)練,近年來受到廣泛關(guān)注。設(shè)計輕量級但有效的模型非常有意義,這樣它們就可以部署在邊緣設(shè)備上。
    的頭像 發(fā)表于 03-14 17:54 ?2904次閱讀

    介紹第一個結(jié)合相對和絕對深度的多模態(tài)深度估計網(wǎng)絡(luò)

    深度估計分為兩個派系,metric depth estimation(度量深度估計,也稱絕對
    的頭像 發(fā)表于 03-21 18:01 ?7566次閱讀

    一種利用幾何信息的自監(jiān)督深度估計框架

    本文方法是一種自監(jiān)督的深度估計框架,名為GasMono,專門設(shè)計用于室內(nèi)場景。本方法通過應(yīng)用多視圖幾何的方式解決了室內(nèi)場景中幀間大旋轉(zhuǎn)和低紋理導(dǎo)致自監(jiān)督
    發(fā)表于 11-06 11:47 ?721次閱讀
    一種利用幾何信息的自監(jiān)督<b class='flag-5'>單</b><b class='flag-5'>目</b><b class='flag-5'>深度</b><b class='flag-5'>估計</b>框架

    動態(tài)場景的自監(jiān)督深度估計方案

    自監(jiān)督深度估計的訓(xùn)練可以在大量無標(biāo)簽視頻序列來進行,訓(xùn)練集獲取很方便。但問題是,實際采集的視頻序列往往會有很多動態(tài)物體,而自監(jiān)督訓(xùn)練本身就是基于靜態(tài)環(huán)境假設(shè),動態(tài)環(huán)境
    發(fā)表于 11-28 09:21 ?1091次閱讀
    動態(tài)場景<b class='flag-5'>下</b>的自監(jiān)督<b class='flag-5'>單</b><b class='flag-5'>目</b><b class='flag-5'>深度</b><b class='flag-5'>估計</b>方案

    深度估計開源方案分享

    可以看一下單深度估計效果,這個深度圖的分辨率是真的高,物體邊界分割的非常干凈!這里也推薦工坊推出的新課程《
    的頭像 發(fā)表于 12-17 10:01 ?1184次閱讀
    <b class='flag-5'>單</b><b class='flag-5'>目</b><b class='flag-5'>深度</b><b class='flag-5'>估計</b>開源方案分享

    【AIBOX 應(yīng)用案例】深度估計

    了關(guān)鍵作用。深度估計技術(shù)可以分為多深度估計
    的頭像 發(fā)表于 03-19 16:33 ?424次閱讀
    【AIBOX 應(yīng)用案例】<b class='flag-5'>單</b><b class='flag-5'>目</b><b class='flag-5'>深度</b><b class='flag-5'>估計</b>