一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么在自動駕駛中使用數(shù)據(jù)增強(qiáng)?為什么自動駕駛汽車的數(shù)據(jù)不一樣?

工程師鄧生 ? 來源:智車科技 ? 作者:智車科技 ? 2020-10-27 09:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

與其他目標(biāo)檢測問題相比,自動駕駛本身有著特殊性。那么,在自動駕駛的訓(xùn)練中,沿用一般的數(shù)據(jù)增強(qiáng)手段是否有較好的效果呢?本文介紹分享DeepScale深度學(xué)習(xí)軟件工程師Matthew Cooper在針對該問題的一些實驗和探討。

DeepScale 從2019年起由于被特斯拉收購的消息而備受關(guān)注,其旨在幫助汽車制造商使用大多數(shù)汽車中標(biāo)準(zhǔn)的低功率處理器來提供非常精確的計算機(jī)視覺,專注于開發(fā)自動駕駛汽車的深度神經(jīng)網(wǎng)絡(luò)。而在深度神經(jīng)網(wǎng)絡(luò)應(yīng)用中,數(shù)據(jù)可以通過多種方式進(jìn)行擴(kuò)充,以避免過度擬合,從而提高模型檢測性能。

圖像增強(qiáng)實驗與結(jié)果

為了改善目標(biāo)檢測性能,在構(gòu)建數(shù)據(jù)增強(qiáng)器時,經(jīng)常會使用一種稱為Cutout的正則化技術(shù)。簡而言之,Cutout會在圖像中使隨機(jī)放置的正方形變黑。

Cutout應(yīng)用于CIFAR-10 dataset中的圖像

一般情況下,Cutout可以顯著提高視覺應(yīng)用的準(zhǔn)確性。但是,當(dāng)將其應(yīng)用于這些數(shù)據(jù)時,我們的檢測mmAP降低了。我們搜索了這個問題后驚訝地發(fā)現(xiàn),我們使用的所有增強(qiáng)器都極大地?fù)p害了檢測性能。

在探索的開始,我們使用了Filp(翻轉(zhuǎn))、Crop(裁剪)和權(quán)重衰減正則化,這些都是用于目標(biāo)檢測的常用方案。通過研究,我們發(fā)現(xiàn)這些數(shù)據(jù)在我們的數(shù)據(jù)集上均會損害檢測性能。而刪除這些增強(qiáng)器可使網(wǎng)絡(luò)的初始性能提高13%mmAP 。(mmAP是COCO目標(biāo)檢測挑戰(zhàn)中的默認(rèn)評估指標(biāo))

目標(biāo)檢測常用方案的效果

通常,我們希望使用權(quán)重衰減、Flip和Crop來將性能提高幾個點,如上圖中虛線所示。但是,在這次的案例中,這些增強(qiáng)器分別對mmAP造成8.4%、0.1%和4.5%的損害。刪除所有增強(qiáng)器可將整體性能提升13%。

那么,為什么這些標(biāo)準(zhǔn)的增強(qiáng)器會損害檢測性能呢?為了解釋這些,我們要從根本原理來重新審視圖像增強(qiáng)的想法。

為什么使用數(shù)據(jù)增強(qiáng)?

過度擬合是深度神經(jīng)網(wǎng)絡(luò)的常見問題。神經(jīng)網(wǎng)絡(luò)非常靈活;但是,考慮到常見數(shù)據(jù)集的大小,它們通常會被過度參數(shù)化。這將導(dǎo)致一個模型,該模型學(xué)習(xí)數(shù)據(jù)集中的“噪聲”而不是“信號”。換句話說,他們可以記住數(shù)據(jù)集的意外屬性,而不是學(xué)習(xí)有意義的常規(guī)信息。結(jié)果,當(dāng)提供新的實際數(shù)據(jù)時,過擬合網(wǎng)絡(luò)無法得到正確的結(jié)果。

為了解決過度擬合問題,我們經(jīng)常選擇擴(kuò)充訓(xùn)練數(shù)據(jù)。擴(kuò)充圖像數(shù)據(jù)的常用方法包括水平隨機(jī)翻轉(zhuǎn)圖像(Flip)、改變其色相(色相抖動)或裁剪隨機(jī)部分(Crop)。

原始長頸鹿圖像(左上方)、Flip(右上方)、色相抖動(左下方)、Crop(右下方)。雖然進(jìn)行了不同的變換,但每個圖像依然都是長頸鹿。

諸如Flip、色相抖動和Crop之類的增強(qiáng)器有助于消除過度擬合,因為它們提高了網(wǎng)絡(luò)的泛化能力。如果訓(xùn)練網(wǎng)絡(luò)以識別面向右的長頸鹿并在面向左的長頸鹿的翻轉(zhuǎn)圖像上進(jìn)行訓(xùn)練,則網(wǎng)絡(luò)將知道長頸鹿是長頸鹿,而不管朝向如何。這就使得網(wǎng)絡(luò)正確學(xué)習(xí)有關(guān)長頸鹿的相關(guān)信息(如棕色斑點毛皮),也能正確地排除一般信息。

諸如COCO目標(biāo)檢測挑戰(zhàn)之類的公共數(shù)據(jù)集一般具有泛化的需求。由于這些數(shù)據(jù)集包含從多種來源聚合而來的圖像,這些圖像是在不同條件下從不同的相機(jī)拍攝的,因此網(wǎng)絡(luò)需要概括出許多因素才能發(fā)揮出色的性能。網(wǎng)絡(luò)需要應(yīng)對的一些變量是:光、比例、攝像機(jī)固有特性(如焦距,主點偏移和軸偏斜)以及攝像機(jī)外部特性(如位置、角度和旋轉(zhuǎn))。通過使用數(shù)據(jù)增強(qiáng)器,我們可以訓(xùn)練網(wǎng)絡(luò)來概括所有這些變量,就像在上一個示例中我們能夠概括長頸鹿的方向一樣。

來自COCO數(shù)據(jù)集的這些示例是使用不同的相機(jī),不同的角度,比例和姿勢拍攝的,因此有必要學(xué)習(xí)這些屬性的不變性以在COCO目標(biāo)檢測中表現(xiàn)良好。

為什么自動駕駛汽車的數(shù)據(jù)不一樣?

與來自COCO和其他公共數(shù)據(jù)集的數(shù)據(jù)不同,自動駕駛汽車收集的數(shù)據(jù)非常一致。

汽車通常相對于其他車輛和道路物體具有一致的姿勢。此外,所有圖像都來自相同的攝像機(jī),安裝在一樣的位置和角度。這意味著同一系統(tǒng)收集的所有數(shù)據(jù)都具有一致的相機(jī)屬性,例如上面提到的外部特征和固有特征。我們可以使用與量產(chǎn)時相同的傳感器系統(tǒng)來收集訓(xùn)練數(shù)據(jù),因此自動駕駛汽車中的神經(jīng)網(wǎng)絡(luò)不必?fù)?dān)心這些屬性的泛化。因此,適應(yīng)系統(tǒng)的特定攝像機(jī)屬性實際上可能是有益的。

這些來自Berkeley Deep Drive數(shù)據(jù)集中每個汽車的示例都是從同一攝像機(jī)以相同的角度和姿勢拍攝的。它們還具有相同的偽影,例如擋風(fēng)玻璃反射和每幀右下角的物體。

由于自動駕駛汽車數(shù)據(jù)具有一致性,這導(dǎo)致使用一般數(shù)據(jù)增強(qiáng)器(例如Flip和Crop)對性能的損害超過其幫助。原因很簡單:翻轉(zhuǎn)訓(xùn)練圖像是沒有意義的,因為攝像頭將始終處于相同角度,并且汽車將始終位于道路的右側(cè)(因國家而已)。汽車幾乎永遠(yuǎn)不會在道路的左側(cè),攝像頭也永遠(yuǎn)不會翻轉(zhuǎn)角度,因此對翻轉(zhuǎn)數(shù)據(jù)進(jìn)行訓(xùn)練會導(dǎo)致模型過度包含一些不會發(fā)生的場景。同樣,裁剪具有移動和縮放原始圖像的效果。由于汽車的攝像頭將始終位于相同位置,因此這種移動和縮放會導(dǎo)致網(wǎng)絡(luò)會浪費其對不相關(guān)場景的預(yù)測能力。

如何改進(jìn)?

現(xiàn)在,我們理解了自動駕駛汽車數(shù)據(jù)具有一致性,導(dǎo)致了之前那些增強(qiáng)器不太理想的結(jié)果。接下來,我們來看看是否可以利用這種一致性來進(jìn)一步提高性能。

在引入任何新的擴(kuò)充器之前,我檢查了我們的數(shù)據(jù)集以查看是否可以在數(shù)據(jù)級別進(jìn)行任何改進(jìn)。我們的訓(xùn)練集最初包括來自兩個廣角相機(jī)和一個帶變焦鏡頭的相機(jī)的圖像。變焦鏡頭產(chǎn)生類似于Crop的縮放和移動效果。在測試時,我們僅使用廣角相機(jī),因此對縮放圖像進(jìn)行訓(xùn)練會使得網(wǎng)絡(luò)過于籠統(tǒng)。我發(fā)現(xiàn),從訓(xùn)練集中刪除縮放圖像可以大大提高mmAP。這證實了我們的假設(shè),即訓(xùn)練集和測試集之間的一致性對于性能至關(guān)重要。

刪除原始圖像增強(qiáng)器后,我們在新的更一致的新數(shù)據(jù)集上進(jìn)行了訓(xùn)練和測試。相對于原始方案,mmAP額外提高了10.5%。

之后,我們考慮了可以在不更改相機(jī)屬性的情況下更改訓(xùn)練數(shù)據(jù)的增強(qiáng)器。我在該項目開始時實施的Cutout增強(qiáng)似乎是一個不錯的選擇。與Flip和Crop不同,Cutout不會以嚴(yán)重影響相機(jī)屬性的方式(即通過翻轉(zhuǎn),移動或縮放)來更改輸入。取而代之的是,Cutout可以模擬障礙物。障礙物在現(xiàn)實世界的駕駛數(shù)據(jù)中很常見,而障礙物的不變性可以幫助網(wǎng)絡(luò)檢測部分被遮擋的物體。

障礙物在現(xiàn)實世界的駕駛數(shù)據(jù)中很常見。在此圖像中,兩個行人擋住了我們對警車的視野,而大包擋住了我們對行人的視野。

色相抖動(Hue jitter)還可以在不影響相機(jī)屬性的情況下幫助泛化。色相抖動只是將輸入的色相移動一個隨機(jī)量。這有助于網(wǎng)絡(luò)對顏色進(jìn)行泛化(例如,紅色汽車和藍(lán)色汽車都應(yīng)被檢測為汽車)。不出所料,Cutout和色相抖動都改善了在新數(shù)據(jù)集上的性能。

向新數(shù)據(jù)集中添加Cutout和色相抖動增強(qiáng),相對mmAP分別增加了1%和0.2%。這比原始方案(即舊數(shù)據(jù)集上的Flip、Crop和權(quán)重衰減)提高了24.7%。

值得注意的是,這些增強(qiáng)技巧不適用于包含來自不同相機(jī)類型、不同角度和比例的圖像數(shù)據(jù)集。為了證明這一點,我們通過隨機(jī)翻轉(zhuǎn)和剪裁創(chuàng)建了具有多種相機(jī)屬性的測試集。不出所料,在更通用的數(shù)據(jù)集上,我們新的增強(qiáng)方案的性能比原始的一般增強(qiáng)器差。

當(dāng)應(yīng)用于具有一致性的自動駕駛汽車數(shù)據(jù)時,我們的新增強(qiáng)方案(Cutout和色相抖動)與一般增強(qiáng)方案(Flip、Crop和權(quán)重衰減)相比,mmAP提升了11.7%。但是,當(dāng)我們將其應(yīng)用到更多樣化的數(shù)據(jù)時,與一般方案相比,其結(jié)果會下降24.3%。

最后

Flip和Crop等增強(qiáng)方式在很多研究工作上取得了廣泛的成功,以至于我們從沒想過要質(zhì)疑它們對我們特定問題的適用性。當(dāng)我們從根本原理重新審視增強(qiáng)概念時,很明顯我們可以做得更好。機(jī)器學(xué)習(xí)領(lǐng)域有許多類似的“通用最佳實踐”,例如如何設(shè)置學(xué)習(xí)率,使用什么優(yōu)化器以及如何初始化模型。對于機(jī)器學(xué)習(xí)工程師來說,不斷重新審視我們關(guān)于如何訓(xùn)練模型的假設(shè)非常重要,尤其是在針對特定應(yīng)用進(jìn)行構(gòu)建時。學(xué)術(shù)界尚未對此類問題進(jìn)行探討,而通過以嶄新的眼光看它們,我們可以極大地改善機(jī)器學(xué)習(xí)的實際應(yīng)用。
責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7256

    瀏覽量

    91868
  • 自動駕駛
    +關(guān)注

    關(guān)注

    789

    文章

    14321

    瀏覽量

    170637
  • 自動駕駛汽車
    +關(guān)注

    關(guān)注

    4

    文章

    380

    瀏覽量

    41332
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    什么是自動駕駛數(shù)據(jù)標(biāo)注?如何好做數(shù)據(jù)標(biāo)注?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛系統(tǒng)的開發(fā)過程中,數(shù)據(jù)標(biāo)注是項至關(guān)重要的工作。它不僅決定了模型訓(xùn)練的質(zhì)量,也直接影響了車輛感知、決策與控制的性能表現(xiàn)。隨著傳感器種類和
    的頭像 發(fā)表于 07-09 09:19 ?222次閱讀
    什么是<b class='flag-5'>自動駕駛</b><b class='flag-5'>數(shù)據(jù)</b>標(biāo)注?如何好做<b class='flag-5'>數(shù)據(jù)</b>標(biāo)注?

    自動駕駛汽車是如何準(zhǔn)確定位的?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)的快速發(fā)展,車輛的精準(zhǔn)定位成為安全駕駛與路徑規(guī)劃的核心基礎(chǔ)。相比于傳統(tǒng)人類駕駛依賴路標(biāo)和視覺判斷,自動駕駛
    的頭像 發(fā)表于 06-28 11:42 ?226次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>汽車</b>是如何準(zhǔn)確定位的?

    卡車、礦車的自動駕駛和乘用車的自動駕駛技術(shù)要求上有何不同?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛技術(shù)的發(fā)展,讓組合輔助駕駛得到大量應(yīng)用,但現(xiàn)在對于自動駕駛技術(shù)的宣傳,普遍是乘用車領(lǐng)域,而對于卡車、礦車的
    的頭像 發(fā)表于 06-28 11:38 ?207次閱讀
    卡車、礦車的<b class='flag-5'>自動駕駛</b>和乘用車的<b class='flag-5'>自動駕駛</b><b class='flag-5'>在</b>技術(shù)要求上有何不同?

    自動駕駛是為了“增強(qiáng)人”,還是為了“替代人”?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)的日益成熟,人們對它的定位也不斷演進(jìn),究竟是要打造個能為駕駛者提供更佳體驗的“智能副駕”,還是完全替代人類
    的頭像 發(fā)表于 06-25 11:07 ?199次閱讀

    自動駕駛安全基石:ODD

    和限制下可以正常工作,是自動駕駛安全的核心概念之。 ? 對于人類司機(jī)來說,不同的道路上駕駛的能力也有所區(qū)別,比如新手司機(jī)
    的頭像 發(fā)表于 05-19 03:52 ?5135次閱讀

    從《自動駕駛地圖數(shù)據(jù)規(guī)范》聊高精地圖自動駕駛中的重要性

    從技術(shù)、管理和應(yīng)用等多個維度規(guī)范自動駕駛地圖數(shù)據(jù)的生產(chǎn)與使用。 引言 隨著全球范圍內(nèi)自動駕駛技術(shù)的加速發(fā)展,自動駕駛地圖這新型數(shù)字基礎(chǔ)設(shè)施
    的頭像 發(fā)表于 01-05 19:24 ?2315次閱讀
    從《<b class='flag-5'>自動駕駛</b>地圖<b class='flag-5'>數(shù)據(jù)</b>規(guī)范》聊高精地圖<b class='flag-5'>在</b><b class='flag-5'>自動駕駛</b>中的重要性

    標(biāo)貝科技:自動駕駛中的數(shù)據(jù)標(biāo)注類別分享

    自動駕駛訓(xùn)練模型的成熟和穩(wěn)定離不開感知技術(shù)的成熟和穩(wěn)定,訓(xùn)練自動駕駛感知模型需要使用大量準(zhǔn)確真實的數(shù)據(jù)。據(jù)英特爾計算,L3+級自動駕駛每輛汽車
    的頭像 發(fā)表于 11-22 15:07 ?2017次閱讀
    標(biāo)貝科技:<b class='flag-5'>自動駕駛</b>中的<b class='flag-5'>數(shù)據(jù)</b>標(biāo)注類別分享

    標(biāo)貝科技:自動駕駛中的數(shù)據(jù)標(biāo)注類別分享

    自動駕駛訓(xùn)練模型的成熟和穩(wěn)定離不開感知技術(shù)的成熟和穩(wěn)定,訓(xùn)練自動駕駛感知模型需要使用大量準(zhǔn)確真實的數(shù)據(jù)。據(jù)英特爾計算,L3+級自動駕駛每輛汽車
    的頭像 發(fā)表于 11-22 14:58 ?3791次閱讀
    標(biāo)貝科技:<b class='flag-5'>自動駕駛</b>中的<b class='flag-5'>數(shù)據(jù)</b>標(biāo)注類別分享

    自動駕駛算法數(shù)據(jù)鏈路是怎么的?#ADAS #智能駕駛

    自動駕駛
    北匯信息POLELINK
    發(fā)布于 :2024年11月20日 13:05:51

    MEMS技術(shù)自動駕駛汽車中的應(yīng)用

    MEMS技術(shù)自動駕駛汽車中的應(yīng)用主要體現(xiàn)在傳感器方面,這些傳感器為自動駕駛汽車提供了關(guān)鍵的環(huán)境感知和數(shù)
    的頭像 發(fā)表于 11-20 10:19 ?1453次閱讀

    自動駕駛汽車安全嗎?

    隨著未來汽車變得更加互聯(lián),汽車逐漸變得更加依賴技術(shù),并且逐漸變得更加自動化——最終實現(xiàn)自動駕駛,了解自動駕駛
    的頭像 發(fā)表于 10-29 13:42 ?1123次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>汽車</b>安全嗎?

    FPGA自動駕駛領(lǐng)域有哪些優(yōu)勢?

    FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列)自動駕駛領(lǐng)域具有顯著的優(yōu)勢,這些優(yōu)勢使得FPGA成為自動駕駛技術(shù)中不可或缺的部分。以下是FP
    發(fā)表于 07-29 17:11

    FPGA自動駕駛領(lǐng)域有哪些應(yīng)用?

    是FPGA自動駕駛領(lǐng)域的主要應(yīng)用: 、感知算法加速 圖像處理:自動駕駛中需要通過攝像頭獲取并識別道路信息和行駛環(huán)境,這涉及到大量的圖像處理任務(wù)。FPGA
    發(fā)表于 07-29 17:09

    自動駕駛汽車傳感器有哪些

    自動駕駛汽車傳感器是實現(xiàn)自動駕駛功能的關(guān)鍵組件,它們通過采集和處理車輛周圍環(huán)境的信息,為自動駕駛系統(tǒng)提供必要的感知和決策依據(jù)。以下是對自動駕駛
    的頭像 發(fā)表于 07-23 16:00 ?3275次閱讀