一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

BEVSegFormer創(chuàng)造了新的BEV分割SOTA

Nullmax紐勱 ? 來(lái)源:紐勱科技 ? 作者:紐勱科技 ? 2022-04-27 09:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

對(duì)自動(dòng)駕駛而言,BEV(鳥(niǎo)瞰圖)下的語(yǔ)義分割是一項(xiàng)重要任務(wù)。盡管這項(xiàng)工作已經(jīng)吸引了大量的研究,但靈活處理自動(dòng)駕駛車(chē)輛上的任意相機(jī)配置(單個(gè)或多個(gè)攝像頭),仍然是一項(xiàng)挑戰(zhàn)。

為此,Nullmax的感知團(tuán)隊(duì)提出了BEVSegFormer,這一基于Transformer的BEV語(yǔ)義分割方法,可面向任意配置的相機(jī)進(jìn)行BEV語(yǔ)義分割。

這項(xiàng)研究的題目為《BEVSegFormer: Bird's Eye View Semantic Segmentation From Arbitrary Camera Rigs》,論文鏈接:https://arxiv.org/abs/2203.04050。

為了評(píng)估這一算法的效果,Nullmax在nuScenes公開(kāi)數(shù)據(jù)集以及Nullmax的自采數(shù)據(jù)集上進(jìn)行了驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,BEVSegFormer對(duì)任意相機(jī)配置的BEV語(yǔ)義分割,具有出色的性能表現(xiàn)。并且在nuScenes驗(yàn)證集上,BEVSegFormer創(chuàng)造了新的BEV分割SOTA。

在接下來(lái)的工作中,我們還計(jì)劃針對(duì)自動(dòng)駕駛以及BEV語(yǔ)義分割的一些其他挑戰(zhàn),展開(kāi)進(jìn)一步的研究。

歡迎對(duì)計(jì)算機(jī)視覺(jué)及自動(dòng)駕駛感知感興趣的小伙伴加入我們,一起探索!

01

關(guān)于BEVSegFormer

在自動(dòng)駕駛或者機(jī)器人導(dǎo)航系統(tǒng)中,以BEV形式對(duì)感知信息進(jìn)行表征,具有至關(guān)重要的作用,因?yàn)樗梢詾橐?guī)劃和控制提供諸多的便利。

比如,在無(wú)地圖導(dǎo)航方案中,構(gòu)建本地BEV地圖,不僅成為了高精地圖外的另一種選擇,并且對(duì)于包括智體行為預(yù)測(cè)以及運(yùn)動(dòng)規(guī)劃等感知系統(tǒng)下游任務(wù)而言,也非常重要。而利用相機(jī)的輸入進(jìn)行BEV語(yǔ)義分割,通常被視為構(gòu)建本地BEV地圖的第一步。

為此,傳統(tǒng)方法一般會(huì)先在圖像空間生成分割結(jié)果,然后通過(guò)逆透視變換(IPM)函數(shù)轉(zhuǎn)換到BEV空間。雖然這是一種連接圖像空間和BEV空間的簡(jiǎn)單直接的方法,但它需要準(zhǔn)確的相機(jī)內(nèi)外參,或者實(shí)時(shí)的相機(jī)位姿估計(jì)。所以,視圖變換的實(shí)際效果有可能比較差。

以車(chē)道線(xiàn)分割為例,在一些挑戰(zhàn)性場(chǎng)景中,比如遮擋或者遠(yuǎn)處區(qū)域,使用IPM的傳統(tǒng)方法提供的結(jié)果就不夠準(zhǔn)確,如圖所示。

d90fae6c-c5ca-11ec-bce3-dac502259ad0.png

近年來(lái),深度學(xué)習(xí)方法已被研究用于BEV語(yǔ)義分割。Lift-Splat-Shoot通過(guò)逐像素深度估計(jì)結(jié)果完成了從圖像視圖到BEV的視圖變換。不過(guò)使用深度估計(jì),也增加了視圖變換過(guò)程的復(fù)雜度。此外,有一些方法應(yīng)用MLP或者FC算子來(lái)進(jìn)行視圖變換。這些固定的視圖變換方法,學(xué)習(xí)圖像空間和BEV空間之間的固定映射,因此不依賴(lài)于輸入的數(shù)據(jù)。

而基于Transformer的方法,是在BEV空間下進(jìn)行感知的另一個(gè)研究方向。在目標(biāo)檢測(cè)任務(wù)中,DETR3D引入了一種3D邊界框檢測(cè)方法,直接從多個(gè)相機(jī)圖像的2D特征生成3D空間中的預(yù)測(cè)。3D空間和2D圖像空間之間的視圖變換,通過(guò)交叉注意模塊的3D到2D查詢(xún)來(lái)實(shí)現(xiàn)。

受此啟發(fā),我們提出了BEVSegFormer,通過(guò)在Transformer中使用交叉注意機(jī)制進(jìn)行BEV到圖像的查詢(xún),來(lái)計(jì)算視圖變換。

BEVSegFormer由3個(gè)主要的組件組成:

共享的主干網(wǎng)絡(luò),用于提取任意相機(jī)的特征圖;

Transformer編碼器,通過(guò)自注意模塊嵌入特征圖;

BEV Transformer解碼器,通過(guò)交叉注意機(jī)制處理BEV查詢(xún),輸出最終的BEV語(yǔ)義分割結(jié)果。

d944de0c-c5ca-11ec-bce3-dac502259ad0.png

具體來(lái)說(shuō),BEVSegFormer首先是使用了共享的主干網(wǎng)絡(luò),對(duì)來(lái)自任意相機(jī)的圖像特征進(jìn)行編碼,然后通過(guò)基于可變形Transformer的編碼器對(duì)這些特征進(jìn)行增強(qiáng)。

除此之外,BEVSegFormer還引入了一個(gè)BEV Transformer解碼器模塊,對(duì)BEV語(yǔ)義分割的結(jié)果進(jìn)行解析,以及一種高效的多相機(jī)可變形注意單元,完成BEV到圖像的視圖變換。

最后,根據(jù)BEV中的網(wǎng)格布局對(duì)查詢(xún)進(jìn)行重塑,并進(jìn)行上采樣,以有監(jiān)督的方式生成語(yǔ)義分割結(jié)果。

我們分別在nuScenes公開(kāi)數(shù)據(jù)集以及Nullmax的自采數(shù)據(jù)集上,檢驗(yàn)了BEVSegFormer的算法效果。實(shí)驗(yàn)結(jié)果表明,BEVSegFormer在nuScenes驗(yàn)證集上創(chuàng)造了新的BEV分割SOTA。通過(guò)消融實(shí)驗(yàn),當(dāng)中每個(gè)組件的效果也得到了驗(yàn)證。

d97c3780-c5ca-11ec-bce3-dac502259ad0.png

02

加入我們

在這項(xiàng)研究中,我們?yōu)榱藨?yīng)對(duì)自動(dòng)駕駛車(chē)輛上任意相機(jī)配置的BEV語(yǔ)義分割挑戰(zhàn),提出了BEVSegFormer。

接下來(lái),我們還計(jì)劃在自動(dòng)駕駛當(dāng)中,基于Transformer探索內(nèi)存效率更高、解釋性更強(qiáng)的BEV語(yǔ)義分割方法。

歡迎對(duì)BEV、Transformer在自動(dòng)駕駛中的感知任務(wù)感興趣,以及希望從事于計(jì)算機(jī)視覺(jué)和自動(dòng)駕駛感知研發(fā)的同學(xué),加入Nullmax感知團(tuán)隊(duì)。

在這里,你可以直接參與到大量自動(dòng)駕駛量產(chǎn)項(xiàng)目的落地,以及最前沿技術(shù)的預(yù)研當(dāng)中,為你的idea和技術(shù)找到一個(gè)充分施展的舞臺(tái)!

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    790

    文章

    14323

    瀏覽量

    170706
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122806

原文標(biāo)題:當(dāng)BEV語(yǔ)義分割遇上了Transformer,故事的結(jié)局是新的SOTA

文章出處:【微信號(hào):Nullmax,微信公眾號(hào):Nullmax紐勱】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【正點(diǎn)原子STM32MP257開(kāi)發(fā)板試用】基于 DeepLab 模型的圖像分割

    【正點(diǎn)原子STM32MP257開(kāi)發(fā)板試用】圖像分割 本文介紹正點(diǎn)原子 STM32MP257 開(kāi)發(fā)板基于 DeepLab 模型實(shí)現(xiàn)圖像分割的項(xiàng)目設(shè)計(jì)。 DeepLab 模型 DeepLab-v3
    發(fā)表于 06-21 21:11

    淺析4D-bev標(biāo)注技術(shù)在自動(dòng)駕駛領(lǐng)域的重要性

    感知領(lǐng)域的一項(xiàng)突破性創(chuàng)新,通過(guò)引入時(shí)間維度與全局視角,為自動(dòng)駕駛系統(tǒng)提供高精度、多模態(tài)的時(shí)空真值數(shù)據(jù),重塑自動(dòng)駕駛系統(tǒng)的開(kāi)發(fā)范式。 4D-BEV標(biāo)注是什么? 4D-BEV 標(biāo)注技術(shù)
    的頭像 發(fā)表于 06-12 16:10 ?382次閱讀

    康謀方案 | BEV感知技術(shù):多相機(jī)數(shù)據(jù)采集與高精度時(shí)間同步方案

    隨著自動(dòng)駕駛技術(shù)的快速發(fā)展,車(chē)輛準(zhǔn)確感知周?chē)h(huán)境的能力變得至關(guān)重要。BEV Camera數(shù)據(jù)采集方案有效解決多相機(jī)同步采集和高精度時(shí)間同步的難題,還提供靈活的相機(jī)參數(shù)配置和高效的數(shù)據(jù)傳輸,能夠滿(mǎn)足自動(dòng)駕駛和高精度測(cè)量等場(chǎng)景的
    的頭像 發(fā)表于 02-06 13:45 ?3485次閱讀
    康謀方案 | <b class='flag-5'>BEV</b>感知技術(shù):多相機(jī)數(shù)據(jù)采集與高精度時(shí)間同步方案

    Mamba入局圖像復(fù)原,達(dá)成新SOTA

    MambaIRv2,更高性能、更高效率!另外還有ACM MM 2024上的Freqmamba方法,在圖像去雨任務(wù)中取得了SOTA性能! 顯然,這種基于Mamba的方法在圖像復(fù)原領(lǐng)域,比基于CNN
    的頭像 發(fā)表于 12-30 18:09 ?853次閱讀
    Mamba入局圖像復(fù)原,達(dá)成新<b class='flag-5'>SOTA</b>

    淺析基于自動(dòng)駕駛的4D-bev標(biāo)注技術(shù)

    4D-bev標(biāo)注技術(shù)是指在3D空間中以時(shí)間作為第四個(gè)維度進(jìn)行標(biāo)注的過(guò)程。4D-bev通常在地場(chǎng)景較為復(fù)雜的自動(dòng)駕駛場(chǎng)景中使用,其可以通過(guò)精準(zhǔn)地跟蹤和記錄動(dòng)態(tài)對(duì)象的運(yùn)動(dòng)軌跡、姿勢(shì)變化以及速度等信息,全面理解和分析動(dòng)態(tài)對(duì)象在連續(xù)的時(shí)間序列中的變化,提升自動(dòng)駕駛系統(tǒng)的感知、決策
    的頭像 發(fā)表于 12-06 15:01 ?3540次閱讀
    淺析基于自動(dòng)駕駛的4D-<b class='flag-5'>bev</b>標(biāo)注技術(shù)

    電裝新技術(shù)助力BEV電池循環(huán)再利用

    隨著全球?qū)p少溫室氣體排放和提高能源效率的迫切需求,電動(dòng)汽車(chē)(Battery Electric Vehicle,簡(jiǎn)稱(chēng)BEV)已經(jīng)成為推動(dòng)交通行業(yè)轉(zhuǎn)型的關(guān)鍵力量。然而,隨著電動(dòng)汽車(chē)的普及,車(chē)載電池
    的頭像 發(fā)表于 12-05 14:22 ?481次閱讀

    自動(dòng)駕駛中一直說(shuō)的BEV+Transformer到底是個(gè)啥?

    在很多車(chē)企的自動(dòng)駕駛介紹中,都會(huì)聽(tīng)到一個(gè)關(guān)鍵技術(shù),那就是BEV+Transformer,那BEV+Transformer到底是個(gè)啥?為什么很多車(chē)企在自動(dòng)駕駛技術(shù)中都十分追捧這項(xiàng)技術(shù)?其實(shí)“BEV
    的頭像 發(fā)表于 11-07 11:19 ?1393次閱讀
    自動(dòng)駕駛中一直說(shuō)的<b class='flag-5'>BEV</b>+Transformer到底是個(gè)啥?

    淺談分割接地層的利弊

    如果分割接地層并且線(xiàn)路穿過(guò)分割線(xiàn)(如圖1所示)那么電流返回通路在哪里呢?假設(shè)兩個(gè)層在某處連接(通過(guò)在一個(gè)單獨(dú)點(diǎn)),則返回電流必在該大型環(huán)路內(nèi)流動(dòng)。大型環(huán)路內(nèi)的高頻電流產(chǎn)生輻射和高接地電感。大型環(huán)路內(nèi)的低電平模擬電流易受干擾的影響。
    的頭像 發(fā)表于 10-30 10:09 ?608次閱讀
    淺談<b class='flag-5'>分割</b>接地層的利弊

    語(yǔ)義分割25種損失函數(shù)綜述和展望

    本綜述提供對(duì)25種用于圖像分割的損失函數(shù)的全面且統(tǒng)一的回顧。我們提供一種新穎的分類(lèi)法,并詳細(xì)審查這些損失函數(shù)如何在圖像分割中被定制和利
    的頭像 發(fā)表于 10-22 08:04 ?1624次閱讀
    語(yǔ)義<b class='flag-5'>分割</b>25種損失函數(shù)綜述和展望

    畫(huà)面分割器怎么調(diào)試

    畫(huà)面分割器,通常指的是視頻畫(huà)面分割器,它是一種可以將一個(gè)視頻信號(hào)分割成多個(gè)小畫(huà)面的設(shè)備。這種設(shè)備廣泛應(yīng)用于監(jiān)控系統(tǒng)、視頻會(huì)議、多畫(huà)面顯示等場(chǎng)景。調(diào)試畫(huà)面分割器是一個(gè)技術(shù)性很強(qiáng)的工作,需
    的頭像 發(fā)表于 10-17 09:32 ?1086次閱讀

    畫(huà)面分割器怎么連接

    畫(huà)面分割器,也稱(chēng)為視頻分割器或多畫(huà)面處理器,是一種可以將多個(gè)視頻信號(hào)源分割成單個(gè)畫(huà)面或多個(gè)畫(huà)面顯示在單個(gè)監(jiān)視器上的設(shè)備。這種設(shè)備廣泛應(yīng)用于監(jiān)控系統(tǒng)、視頻會(huì)議、多媒體展示等領(lǐng)域。 一、畫(huà)面分割
    的頭像 發(fā)表于 10-17 09:29 ?998次閱讀

    畫(huà)面分割器和分屏器有什么區(qū)別

    畫(huà)面分割器和分屏器是兩種在視頻處理領(lǐng)域常見(jiàn)的設(shè)備,它們的主要功能是將多個(gè)視頻信號(hào)合并到一個(gè)顯示設(shè)備上。盡管它們的功能相似,但在技術(shù)實(shí)現(xiàn)、應(yīng)用場(chǎng)景和用戶(hù)體驗(yàn)上存在一些差異。以下是對(duì)這兩種設(shè)備的比較
    的頭像 發(fā)表于 10-17 09:25 ?1971次閱讀

    畫(huà)面分割器有幾路主輸出

    畫(huà)面分割器,也稱(chēng)為視頻分割器或多畫(huà)面處理器,是一種可以將一個(gè)視頻信號(hào)分割成多個(gè)獨(dú)立視頻畫(huà)面的設(shè)備。這種設(shè)備廣泛應(yīng)用于監(jiān)控系統(tǒng)、視頻會(huì)議、多媒體展示等領(lǐng)域,能夠?qū)⒍鄠€(gè)攝像頭的信號(hào)整合到一個(gè)顯示設(shè)備上
    的頭像 發(fā)表于 10-17 09:24 ?865次閱讀

    畫(huà)面分割器的主要功能

    畫(huà)面分割器,也稱(chēng)為視頻分割器或多畫(huà)面分割器,是一種用于將多個(gè)視頻信號(hào)整合到一個(gè)顯示器上顯示的設(shè)備。這種設(shè)備廣泛應(yīng)用于監(jiān)控系統(tǒng)、視頻會(huì)議、指揮中心等場(chǎng)合,以便于用戶(hù)同時(shí)監(jiān)控多個(gè)視頻源。 畫(huà)面分割
    的頭像 發(fā)表于 10-17 09:22 ?1928次閱讀

    關(guān)于\"OPA615\"的SOTA的跨導(dǎo)大小的疑問(wèn)求解

    關(guān)于OPA615的SOTA部分,看datasheet的page9的figure22,我們可以知道跨導(dǎo)大小大概是35mA/V左右,并且可以知道其Chold輸出一般在5mA以?xún)?nèi),但是我從社區(qū)里面找到
    發(fā)表于 09-13 06:25