一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺析特征提取網(wǎng)絡(luò)與特征融合技術(shù)

新機(jī)器視覺 ? 來源:知乎 ? 作者:henry一個理工boy ? 2021-03-12 10:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀鑒于顯著性目標(biāo)和偽裝目標(biāo)研究的相似性,本文作者將顯著性目標(biāo)與偽裝目標(biāo)合在一起進(jìn)行研究,文章重點是特征提取網(wǎng)絡(luò)與特征融合技術(shù),主要介紹了三種方法EGNet,PFANet和SINet。

在自然界中許多生物都具有“偽裝”的本領(lǐng),變色龍能夠根據(jù)周遭的環(huán)境來調(diào)整自身顏色以達(dá)到其“偽裝”的目的;獅子將身體“偽裝”在草叢之中而伺機(jī)等待獵物的靠近;蝴蝶躺在與自身顏色相近的樹干上一動不動以躲過天敵的傷害。生物學(xué)家將這類偽裝方式稱為背景匹配,即動物為避免被識別,會嘗試改變其自身顏色以“完美”地融入周圍環(huán)境。

如今,隨著CV領(lǐng)域在深度學(xué)習(xí)方向上的發(fā)展,學(xué)者們把目光投向了目標(biāo)檢測這一領(lǐng)域。與通用目標(biāo)檢測以及顯著性目標(biāo)檢測不一樣,通用目標(biāo)檢測與顯著性目標(biāo)檢測中目標(biāo)與背景均有較為明顯的差異性,這種差異通常情況下通過人眼也能較容易地分辨出來。但偽裝目標(biāo)檢測中偽裝目標(biāo)與背景之間存在高度的相似性,因此關(guān)于偽裝目標(biāo)的檢測顯得更具挑戰(zhàn)性。

在我看來,偽裝目標(biāo)的檢測與通用目標(biāo)檢測有所區(qū)別,但和顯著性目標(biāo)檢測有點類似,更多的是做語義分割,但不同于語義分割,偽裝目標(biāo)里的分割時一個二分類的問題(即前景和背景的分割)顯著性目標(biāo)檢測把輸入圖像分為顯著物體和背景,偽裝目標(biāo)是分割為偽裝目標(biāo)和背景。鑒于顯著性目標(biāo)和偽裝目標(biāo)研究的相似性,于是我將顯著性目標(biāo)與偽裝目標(biāo)合在一起進(jìn)行研究。特征提取網(wǎng)絡(luò)與特征融合技術(shù)是我研究的重點。

關(guān)于偽裝目標(biāo)研究可應(yīng)用的領(lǐng)域十分廣闊,除了其學(xué)術(shù)價值外,偽裝物體檢測還有助于推動諸如軍事上偽裝隱蔽目標(biāo)的搜索探測、醫(yī)學(xué)領(lǐng)域上病情的判斷以及農(nóng)業(yè)遙感中蝗蟲的入侵等等。

目前,由于缺乏規(guī)模足夠大的數(shù)據(jù)集,偽裝物體檢測的研究還不夠深入,所以目前所有的研究都是基于由南開大學(xué)團(tuán)隊為COD任務(wù)專門構(gòu)建出的COD10K數(shù)據(jù)集。

本次涉及三個方法,前兩個是針對顯著性目標(biāo)檢測所提出的,分別是EGNet和PFANet;而后面的是專門針對于偽裝目標(biāo)檢測提出的SINet。

首先對EGNet進(jìn)行介紹,EGNet,也稱為邊緣引導(dǎo)網(wǎng)絡(luò),顧名思義,我們知道他在保護(hù)邊緣信息上做了功夫,整個方法可以分為三個步驟,第一步是提取邊緣特征(PSFEM),第二步是將局部的邊緣信息和全局的位置信息聚合(NLSEM),最后一步則是將特征進(jìn)行平衡,得到我們想要的最后的特征(O2OGM)。

下面我們來詳細(xì)看一下各個結(jié)構(gòu),首先是PSFEM。EGNet采用的結(jié)構(gòu)是U-net的結(jié)構(gòu),將六個特征層,依次進(jìn)行卷積的操作,然后再經(jīng)過一個卷積層。從Conv3-3、Conv4-3、Conv5-3、Conv6-3四條路徑分別提取目標(biāo)不同層次的特征信息。其中從骨架最后一層的Conv6-3提取的特征卷積后與邊緣信息結(jié)合用于O2OGM模塊;Conv3-3、Conv4-3、Conv5-3、Conv6-3之間都一個從深層到上一淺層的連接(從Conv6-3開始,Conv3-3結(jié)束),用來豐富特征信息。

然后是NLSEM模塊,采用骨架中的Conv-2-2提取目標(biāo)的邊緣特征。不使用Conv1-2是因為其太接近輸入層(噪聲多)并且其感受野較小,不使用Conv3-3及更深的層提取邊緣特征是因為他們所得到的feature map包含的邊緣信息較少,他們更多包含的是語義信息。

最后是O2OGM模塊,將Conv6-3提取的顯著性目標(biāo)特征信息與Conv2-2提取的邊緣特征結(jié)合后的特征分別與Conv3-3、Conv4-3、Conv5-3、Conv6-3每層提取的顯著性目標(biāo)特征進(jìn)行融合,即圖中FF模塊的操作。FF操作很簡單,就是將高層特征上采樣然后進(jìn)行拼接的操作,就可以達(dá)到融合的效果。

PFANet的結(jié)構(gòu)相對簡單,采用VGG網(wǎng)絡(luò)作為特征提取網(wǎng)絡(luò),然后將前兩層特征稱為低層特征,后三層特征稱為高層特征,對他們采用了不同的方式進(jìn)行特征增強(qiáng),以增強(qiáng)檢測效果。

首先是對于高層特征,先是采用了一個CPFE來增大感受野,然后再接一個通道注意力模塊,即完成了對高層特征的特征增強(qiáng)(這里的這個CPFE,其實就是ASPP)。

然后再對經(jīng)過了CPFE后的高層特征使用通道注意力(CA)。

38ac622c-82cc-11eb-8b86-12bb97331649.png

以上即是高層特征的增強(qiáng)方法,而對于低層特征,處理得則更為簡單,只需要使用空間注意力模塊(SA),即可完成。

38ee81ca-82cc-11eb-8b86-12bb97331649.jpg

整個PFANet的網(wǎng)絡(luò)結(jié)構(gòu)很清晰,如下圖所示。

介紹完EGNet和PFANet兩種方法以后,就剩下SINet了。SINet的思路來自于19年的一篇CVPR的文章《.Cascaded partial decoder for fast and accurate salient object detection》。這篇文章里提出了CPD的這樣一個結(jié)構(gòu),具體的可以取搜索一下這篇論文,詳細(xì)了解一下。

接下來我將介紹一個用于偽裝目標(biāo)檢測的網(wǎng)絡(luò)SINet。假設(shè)你是一頭饑腸轆轆的雄獅,此刻你掃視著周圍,視線突然里出現(xiàn)了兩匹斑馬,他們就是你今天的獵物,美食。確定好了目標(biāo)之后,那么就開始你的獵殺時刻。所以整個過程是你先掃視周圍,我們稱之為搜索,然后,就是確認(rèn)目標(biāo),開始獵殺,我們稱之為確認(rèn)。我們的SINet就是這樣的一個結(jié)構(gòu),他分為搜索和確認(rèn)兩個模塊,前者用于搜索偽裝目標(biāo),后者用于精確定位去檢測他。

我們現(xiàn)在就具體來看看我們的SINet到底是怎么一回事。首先,我們都知道低層特征有著較多的空間細(xì)節(jié),而我們的高層特征,卻有著較多的語義信息。所以低層的特征我們可以用來構(gòu)建目標(biāo)區(qū)域,而高層特征我們則可以用來進(jìn)行目標(biāo)定位。我們將這樣一張圖片,經(jīng)過一個ResNet的特征提取器。按照我們剛才的說法,于是我們將前兩層稱為低層特征,最后兩層稱之為高層特征,而第三層我們稱之為中層特征。那么有了這樣的五層特征圖,東西已經(jīng)給我們了?我們該怎么去利用好這些東西呢?

首先是我們的搜索模塊,通過特征提取,我們得到了這么一些特征,我們希望能夠從這些特征中搜索到我們想要的東西。那我們想要的是什么呢?自然就是我們的偽裝線索了。所以我們需要對我們的特征們做一些增強(qiáng)的處理,來幫助我們完成搜索的這樣一個任務(wù)。而我們用到的方法就是RF。我們來看一下具體是怎么樣實現(xiàn)的。首先我們把整個模塊分為5個分支,這五個分支都進(jìn)行了1×1的卷積降維,我們都知道,空洞卷積的提出,其目的就是為了增大感受野,所以我們對第一個分支進(jìn)行空洞數(shù)為3的空洞卷積,對第二個分支進(jìn)行空洞數(shù)為5的空洞卷積,對第3個分支進(jìn)行空洞數(shù)為7的空洞卷積,然后將前四個分支的特征圖拼接起來,這時候,我們再采用一個1×1卷積降維的操作,與第五個分支進(jìn)行相加的操作,最后輸出增強(qiáng)后的特征圖。

這個RF的結(jié)構(gòu)來自于ECCV2018的一篇論文《 Receptive field block net for accurate and fast object detection》,其作用就是幫助我們獲得足夠的感受野。

我們用RF對感受野增大來進(jìn)行搜索,那么搜索過后,我們得到了增強(qiáng)后的候選特征。我們要從候選特征得到我們最后要的偽裝目標(biāo)的檢測結(jié)果,這里我們用到的方法是PDC模塊(即是部分解碼組件)。

具體操作是這樣的,所以接下來就應(yīng)該是對它們進(jìn)行處理了逐元素相乘方式來減少相鄰特征之間的差距。我們把RF增強(qiáng)后的特征圖作為輸入,輸入到網(wǎng)絡(luò)里面。首先對低層的進(jìn)行一個上采樣,然后進(jìn)行3×3的卷積操作(這里面包含了卷積層,BN層還有Relu層),然后與更高一層的特征圖進(jìn)行乘法的這樣一個操作,我們?yōu)槭裁词褂弥鹪叵喑四??因為逐元素相乘方式能減少相鄰特征之間的差距。然后我們再與輸入的低層特征進(jìn)行拼接。

3a618304-82cc-11eb-8b86-12bb97331649.jpg

我們前面提到了,我們利用增強(qiáng)后的特征通過PDC得到了我們想要得到的檢測結(jié)果,但這樣的一個結(jié)果足夠精細(xì)嗎?其實,這樣得到的檢測結(jié)果是比較粗略的。這是為什么呢?這是因為我們的特征之間并不是有和偽裝檢測不相關(guān)的特征?對于這樣的多余的特征,我們要消滅掉。我們將前面得到的檢測圖稱之為 ,而我們要得到精細(xì)的結(jié)果圖 ,就得使用我們的注意力機(jī)制了。這里我們引入了搜索注意力,具體是怎么實現(xiàn)的呢?大家想一想我們前面把特征分成了低層特征、高層特征還有中層特征。我們平時一般都叫低層特征和高層特征,很少有提到中層特征的。其實我們這里這樣叫,是有打算的,我們認(rèn)為中層特征他既不像低層特征那么淺顯,也不像高層特征那樣抽象,所以我們對他進(jìn)行一個卷積操作(但是我們的卷積核用的是高斯核函數(shù)方差取32,核的尺寸我們?nèi)?,我們學(xué)過數(shù)字圖像處理,都知道這樣的一個操作能起到一個濾波的作用,我們的不相關(guān)特征能被過濾掉)但是有同學(xué)就會問了,那你這樣一過濾,有用的特征不也過濾掉了嗎?基于這樣的考慮,我們把過濾后的特征圖與剛才的這個 再來做一個函數(shù),什么函數(shù)呢?就是一個最大化函數(shù),這樣我們不就能來突出偽裝圖 初始的偽裝區(qū)域了嗎?

SINet整體的框架如圖所示:

講了這么多,我們最后來看看實驗的效果,通過對這三篇文章的復(fù)現(xiàn),我得到了下面的這樣一些結(jié)果。

3b25c3c2-82cc-11eb-8b86-12bb97331649.jpg

可以看出,在精度指標(biāo)的評價方面,SINet相比于其他兩種方法都有很大提升,而PFANet模型結(jié)構(gòu)雖然很簡單,但他的效果也是最差的。

下面我們再看看可視化的效果:


編輯:lyn

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 特征提取
    +關(guān)注

    關(guān)注

    1

    文章

    29

    瀏覽量

    9967
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122769
  • 特征融合
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    1948

原文標(biāo)題:詳解基于深度學(xué)習(xí)的偽裝目標(biāo)檢測

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【EASY EAI Orin Nano開發(fā)板試用體驗】人臉識別提升

    從流程圖中看到識別的流程是這樣的: 如果是剛剛開始,那莫,我們需要對兩張不同的圖片進(jìn)行同樣的人臉特提取,最后是對人臉特征進(jìn)行對比。為了提升效率,我們可以在人臉特征提取后,將這個特征值存
    發(fā)表于 07-05 15:21

    概倫電子標(biāo)準(zhǔn)單元庫特征化解決方案NanoCell介紹

    標(biāo)準(zhǔn)單元庫包括電路設(shè)計、版圖設(shè)計和特征提取,它對芯片設(shè)計至關(guān)重要。其中標(biāo)準(zhǔn)單元庫的特征提取需要大量仿真、模型提取和驗證,在標(biāo)準(zhǔn)單元庫開發(fā)中占據(jù)了三分之一以上的時間。
    的頭像 發(fā)表于 04-16 09:49 ?366次閱讀
    概倫電子標(biāo)準(zhǔn)單元庫<b class='flag-5'>特征</b>化解決方案NanoCell介紹

    給個思路也可以(不知道這個無線通信模塊怎么實現(xiàn))

    有償定做一個智能考勤機(jī) 要求:(1)指紋模塊:采集指紋圖像和傳輸指紋信息,對指紋圖像進(jìn)行預(yù)處理,消除噪聲干擾,還原圖像的真實特征信息。完成特征提取為指紋特征匹配提供依據(jù),并與指紋數(shù)據(jù)庫中的指紋進(jìn)行
    發(fā)表于 03-21 16:50

    使用機(jī)器學(xué)習(xí)改善庫特征提取的質(zhì)量和運(yùn)行時間

    基于靜態(tài)時序分析(STA)的現(xiàn)代設(shè)計流程非常依賴標(biāo)準(zhǔn)單元、IO、存儲器和定制模塊的特征化Liberty模型。高效、準(zhǔn)確的庫特征提取是全芯片或模塊級設(shè)計流程的關(guān)鍵步驟之一,因為它能確保所有庫單元在所
    的頭像 發(fā)表于 12-26 11:15 ?463次閱讀
    使用機(jī)器學(xué)習(xí)改善庫<b class='flag-5'>特征提取</b>的質(zhì)量和運(yùn)行時間

    探討智慧校園的特征與優(yōu)勢

    : 智慧校園的特征 1.智能信息化:智慧校園依托信息技術(shù),實現(xiàn)各類設(shè)備、系統(tǒng)和資源的互聯(lián)互通,建立網(wǎng)絡(luò)化的信息平臺,為師生提供便捷的信息共享和交流環(huán)境。 2.數(shù)據(jù)驅(qū)動:智慧校園借助大數(shù)據(jù)分析和人工智能
    的頭像 發(fā)表于 12-10 15:48 ?522次閱讀

    請教,matlab對于與多個參數(shù)名稱匹配的問題。

    ); % 步驟二:圖像預(yù)處理及特征提取函數(shù) function [features] = extractFeatures(image) % 灰度化 grayImage = rgb2gray(image
    發(fā)表于 11-29 21:51

    數(shù)據(jù)準(zhǔn)備指南:10種基礎(chǔ)特征工程方法的實戰(zhàn)教程

    在數(shù)據(jù)分析和機(jī)器學(xué)習(xí)領(lǐng)域,從原始數(shù)據(jù)中提取有價值的信息是一個關(guān)鍵步驟。這個過程不僅有助于輔助決策,還能預(yù)測未來趨勢。為了實現(xiàn)這一目標(biāo),特征工程技術(shù)顯得尤為重要。特征工程是將原始數(shù)據(jù)轉(zhuǎn)化
    的頭像 發(fā)表于 11-01 08:09 ?613次閱讀
    數(shù)據(jù)準(zhǔn)備指南:10種基礎(chǔ)<b class='flag-5'>特征</b>工程方法的實戰(zhàn)教程

    特征工程實施步驟

    數(shù)據(jù)中提取數(shù)值表示以供無監(jiān)督模型使用的方法(例如,試圖從之前非結(jié)構(gòu)化的數(shù)據(jù)集中提取結(jié)構(gòu))。特征工程包括這兩種情況,以及更多內(nèi)容。數(shù)據(jù)從業(yè)者通常依賴ML和深度學(xué)習(xí)算法
    的頭像 發(fā)表于 10-23 08:07 ?898次閱讀
    <b class='flag-5'>特征</b>工程實施步驟

    音頻特征描述

    電子發(fā)燒友網(wǎng)站提供《音頻特征描述.pdf》資料免費下載
    發(fā)表于 10-10 11:37 ?0次下載
    音頻<b class='flag-5'>特征</b>描述

    中科虹霸推動生物特征識別技術(shù)發(fā)展

    在人工智能技術(shù)飛速發(fā)展的今天,生物特征識別技術(shù)已成為公共安全和個人身份驗證的重要工具。近日,我國四大部門聯(lián)合印發(fā)了《國家人工智能產(chǎn)業(yè)綜合標(biāo)準(zhǔn)化體系建設(shè)指南(2024版)》,其中對生物特征
    的頭像 發(fā)表于 09-27 09:51 ?889次閱讀

    淺談PLC編程軟件的特征

    優(yōu)秀的PLC編程軟件通常具備以下特征。
    的頭像 發(fā)表于 09-20 14:59 ?671次閱讀

    【「時間序列與機(jī)器學(xué)習(xí)」閱讀體驗】時間序列的信息提取

    個重要環(huán)節(jié),目標(biāo)是從給定的時間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測任務(wù)。 特征工程(Feature Engineering)是將數(shù)據(jù)轉(zhuǎn)換為更好地表示潛在問題的特征
    發(fā)表于 08-17 21:12

    【《時間序列與機(jī)器學(xué)習(xí)》閱讀體驗】+ 時間序列的信息提取

    本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環(huán)節(jié),目標(biāo)是從給定的時間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測任務(wù),可以
    發(fā)表于 08-14 18:00

    高光譜成像的黃瓜病蟲害識別和特征波長提取方法

    高光譜成像的黃瓜病蟲害識別和特征波長提取方法黃瓜霜霉病和斑潛蠅是制約黃瓜產(chǎn)業(yè)發(fā)展的嚴(yán)重病蟲害。
    的頭像 發(fā)表于 08-12 15:36 ?1139次閱讀
    高光譜成像的黃瓜病蟲害識別和<b class='flag-5'>特征</b>波長<b class='flag-5'>提取</b>方法

    圖像識別算法的核心技術(shù)是什么

    圖像識別算法是計算機(jī)視覺領(lǐng)域的一個重要研究方向,其目標(biāo)是使計算機(jī)能夠像人類一樣理解和識別圖像中的內(nèi)容。圖像識別算法的核心技術(shù)包括以下幾個方面: 特征提取 特征提取是圖像識別算法的基礎(chǔ),它從原始圖像
    的頭像 發(fā)表于 07-16 11:02 ?1316次閱讀