水下目標(biāo)檢測旨在對水下場景中的物體進(jìn)行定位和識別。這項研究由于在海洋學(xué)、水下導(dǎo)航等領(lǐng)域的廣泛應(yīng)用而引起了持續(xù)的關(guān)注。但是,由于復(fù)雜的水下環(huán)境和光照條件,這仍然是一項艱巨的任務(wù)。因此近年來有多個賽事與水下目標(biāo)檢測相關(guān),如近期正在進(jìn)行的2021全國水下機(jī)器人大賽,接下來我們將介紹在水下目標(biāo)檢測領(lǐng)域的深度學(xué)習(xí)方法概述。
01 水下目標(biāo)檢測的關(guān)鍵問題
1.1 水下圖片模糊
在水下場景中,由于光照影響大大降低了水下圖像的質(zhì)量,從而導(dǎo)致了可見度損失,弱對比度和紋理失真,顏色變化等問題(如下圖所示),并且在水下場景中環(huán)境復(fù)雜,這導(dǎo)致水下目標(biāo)檢測更加困難。
1.2 小目標(biāo)檢測
水下環(huán)境中的目標(biāo)物體通常很小,如:海膽,扇貝,海參等,而當(dāng)前基于深度學(xué)習(xí)的目標(biāo)檢測器通常無法有效地檢測小物體,或者對小目標(biāo)物體的檢測性能較差。
02 水下目標(biāo)檢測的深度學(xué)習(xí)方法
緩解水下圖片模糊主要是通過對水下圖片進(jìn)行增強(qiáng),去噪,復(fù)原等方法,對于小目標(biāo)檢測的問題可以通過數(shù)據(jù)擴(kuò)增和改進(jìn)網(wǎng)絡(luò)的方式來緩解,接下來我們將介紹近年來解決水下目標(biāo)檢測問題的深度學(xué)習(xí)方法。
Underwater object detection using Invert Multi-Class Adaboost with deep learning
論文鏈接: https://arxiv.org/pdf/2005.11552.pdf
代碼鏈接: https://github.com/LongChenCV/SWIPENet
主要方法:文中提出了一種用于水下目標(biāo)小樣本檢測的SWIPENet,網(wǎng)絡(luò)中提出了一種樣本重加權(quán)算法IMA(Invert Multi-Class Adaboost),IMA會減少missed objects(丟失對象)的權(quán)重,以減少這些“干擾”樣本的影響。并且在SWIPENet中引入了具有RELU的空洞卷積層(dilated conv)它們可以在不犧牲特征圖分辨率的情況下獲得大的接受區(qū)域。
IMA算法:首先順序訓(xùn)練多個基本分類器,并根據(jù)其錯誤率Em分配權(quán)重值α。然后,將由前面的分類器分類錯誤的樣本分配較高的權(quán)重,從而使后面的分類器專注于學(xué)習(xí)這些樣本。最后,將所有弱基礎(chǔ)分類器組合在一起,形成具有相應(yīng)權(quán)重的整體分類器。IMA還訓(xùn)練了M次SWIPENet,然后將它們整合為一個統(tǒng)一模型。不同的是,在每次訓(xùn)練迭代中,IMA都會減少丟失對象的權(quán)重,以減少這些“干擾”樣本的影響。
實(shí)驗結(jié)果:達(dá)到URPC 2017的冠軍結(jié)果,45.0map,冠軍為45.1map。
SWIPENet的網(wǎng)絡(luò)結(jié)構(gòu)圖:
RoIMix: Proposal-Fusion among Multiple Images for Underwater Object Detection
論文鏈接: https://arxiv.org/abs/1911.03029
主要方法:URPC 2019水下目標(biāo)檢測競賽冠軍方案:多圖像融合增強(qiáng),針對水下場景重疊和遮擋(水下生物喜歡聚在一起)、模糊(水中沉淀物導(dǎo)致)的問題,提出一種基于候選框融合的圖像增強(qiáng)方法,以生成模擬重疊、遮擋、模糊的訓(xùn)練樣本,從而提高模型的mAP和魯棒性。RoIMix算法使用RPN產(chǎn)生ROI,并以隨機(jī)的比例混合它們。該比例是根據(jù)Beta分布產(chǎn)生的,然后,使用混合樣本來訓(xùn)練模型。
下圖中:
即為用RoIMix圖像增強(qiáng)方法生成的模擬遮擋+模糊的訓(xùn)練樣本
RoIMix的網(wǎng)絡(luò)結(jié)構(gòu)圖:
實(shí)驗結(jié)果:達(dá)到URPC 2019的冠軍方案,ROIMIX和BaseLine之間的最大性能差異為9.05%個mAP值。
An Underwater Image Enhancement Benchmark Dataset and Beyond
論文鏈接: https://arxiv.org/abs/1901.05495v1
代碼鏈接: https://github.com/Li-Chongyi/Water-Net_Code
主要方法:文中提出了一個新的具有950張水下圖片的數(shù)據(jù)集UIEBD,包含各個水下場景,以及水下各種特征退化(光線不足、霧)的情況,用數(shù)據(jù)集UIEBD對12種現(xiàn)階段主流的水下圖片增強(qiáng)算法進(jìn)行評測和驗證。并且提出基于fusion的水下圖片增強(qiáng)模型DuwieNet。
12種水下數(shù)據(jù)擴(kuò)增方法比較:
DUIENet: 基于所構(gòu)建的UIEBD數(shù)據(jù)集,作者提出了一種用于水下圖像增強(qiáng)的CNN模型,稱為DuwieNet。DuwieNet是—種門控融合網(wǎng)絡(luò),它將輸入與預(yù)測的置信度圖融合以獲得增強(qiáng)的結(jié)果。首先通過FTUs將輸入轉(zhuǎn)換為精確的輸入,然后預(yù)測置信度圖。最后,將改進(jìn)后的輸入與相應(yīng)的置信度圖進(jìn)行融合,得到增強(qiáng)后的結(jié)果。其結(jié)構(gòu)圖如下所示:
實(shí)驗結(jié)果:
03 水下目標(biāo)檢測比賽的開源方案
在去年的2020年全國水下機(jī)器人(湛江)大賽水下目標(biāo)檢測比賽眾多,部分選手公開了他們的參賽方案,他們在比賽中的經(jīng)驗這對我們研究水下目標(biāo)檢測具有很大的參考價值,下面我根據(jù)使用的檢測框架進(jìn)行分類,簡單介紹其中的幾個開源方案
3.1 mmdection
和鯨社區(qū)Kesci 水下目標(biāo)檢測算法賽(光學(xué)圖像賽項)三等獎 單模方案
代碼鏈接:https://github.com/milleniums/underwater-object-detection-mmdetection
方法簡述:
使用兩階段檢測框架,保證精度要求;
使用FPN,增強(qiáng)小目標(biāo)的檢測效果;
使用Mixup、旋轉(zhuǎn)等無損的數(shù)據(jù)增強(qiáng)技術(shù),減輕網(wǎng)絡(luò)過擬合,并提升模型泛化能力;
使用多尺度訓(xùn)練與預(yù)測,適應(yīng)圖片分辨率差異,可以讓參與訓(xùn)練的目標(biāo)大小分布更加均衡,使模型對目標(biāo)大小具有一定的魯棒性;
參考ResNet論文,使用Global Context ROI為每個候選框添加上下文信息,充分利用數(shù)據(jù)分布特點(diǎn),提升了檢測精度。
消融實(shí)驗:
和鯨社區(qū)Kesci 水下目標(biāo)檢測算法賽(光學(xué)圖像賽項)30(A榜) / 31(B榜)
代碼鏈接: https://github.com/Wakinguup/Underwater_detection
方法簡述:
1、數(shù)據(jù)增強(qiáng):
采用Mixup、實(shí)例平衡增強(qiáng)、模糊(Median Blur和 Motion Blur)、Retinex、泊松融合、標(biāo)簽平滑。
2、模型框架:mmdetection代碼庫中的Cascade R-CNN模型,其中backbone是ResNeXt101-64x4d (64是基數(shù)Cardinality,X101的一個block的group數(shù)量。而4d是指bottleneck的寬度)。模型同時也搭配了FPN[3],增強(qiáng)模型對小目標(biāo)的檢測能力。
3.2 EfficientDet
EfficientDet訓(xùn)練水下目標(biāo)檢測數(shù)據(jù)集
代碼鏈接: https://github.com/DataXujing/EfficientDet_pytorch
方法簡述:
這個使用EfficientDet進(jìn)行水下目標(biāo)檢測,僅是baseline無任何tricks,Step by Step演示如何訓(xùn)練最近開源的相對SOTA的Pytorch版的EfficientDet的訓(xùn)練,評估,推斷的過程。像paper中提到的一樣,我們并沒有使用任何數(shù)據(jù)增強(qiáng)或模型融合等后處理的trick來提高模型的精度,如果你想增加數(shù)據(jù)增強(qiáng)的策略可以在efficientdet/dataset.py中實(shí)現(xiàn);
3.3 YOLOV5
我們團(tuán)隊這次也參加了2021年全國水下機(jī)器人(湛江)大賽,為大家開源了YOLOV5檢測的baseline
代碼:https://github.com/wangdongdut/Underwater-Object-Detection
04 總結(jié)
水下目標(biāo)檢測目前任然還是一個具有挑戰(zhàn)的領(lǐng)域, 相比于傳統(tǒng)圖像處理方法分多個步驟和環(huán)節(jié)處理檢測任務(wù), 基于深度學(xué)習(xí)的方法將其統(tǒng)一為端到端的特征提取和分類。雖然水下目標(biāo)檢測技術(shù)已經(jīng)不斷地從學(xué)術(shù)研究走向成熟的工業(yè)應(yīng)用, 但是依然有一些需要解決的問題。
編輯:jq
-
機(jī)器人
+關(guān)注
關(guān)注
212文章
29280瀏覽量
210917 -
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7233瀏覽量
90772 -
目標(biāo)檢測
+關(guān)注
關(guān)注
0文章
220瀏覽量
15845
原文標(biāo)題:一文梳理水下目標(biāo)檢測方法
文章出處:【微信號:cas-ciomp,微信公眾號:中科院長春光機(jī)所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
水下燈具氣密性檢測儀的使用方法

一文帶你了解工業(yè)計算機(jī)尺寸

帶你一文了解什么是燈具檢測測試

視頻目標(biāo)跟蹤從0到1,概念與方法

一文詳解SiC單晶生長技術(shù)

一文帶你了解IP地址別名
一文帶你了解IP版本

圖像分割與目標(biāo)檢測的區(qū)別是什么
目標(biāo)檢測與識別技術(shù)有哪些
目標(biāo)檢測與識別技術(shù)的關(guān)系是什么
目標(biāo)檢測識別主要應(yīng)用于哪些方面
慧視小目標(biāo)識別算法 解決目標(biāo)檢測中的老大難問題

基于深度學(xué)習(xí)的小目標(biāo)檢測
一文帶你詳細(xì)了解工業(yè)電腦

評論