一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

解析在目標(biāo)檢測中怎么解決小目標(biāo)的問題?

新機器視覺 ? 來源:AI公園 ? 作者:Nabil MADALI ? 2021-04-26 14:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀

本文介紹了一些小目標(biāo)物體檢測的方法和思路。

深度學(xué)習(xí)目標(biāo)檢測中,特別是人臉檢測中,由于分辨率低、圖像模糊、信息少、噪聲多,小目標(biāo)和小人臉的檢測一直是一個實用和常見的難點問題。然而,在過去幾年的發(fā)展中,也出現(xiàn)了一些提高小目標(biāo)檢測性能的解決方案。本文將對這些方法進(jìn)行分析、整理和總結(jié)。

圖像金字塔和多尺度滑動窗口檢測

一開始,在深學(xué)習(xí)方法成為流行之前,對于不同尺度的目標(biāo),通常是從原始圖像開始,使用不同的分辨率構(gòu)建圖像金字塔,然后使用分類器對金字塔的每一層進(jìn)行滑動窗口的目標(biāo)檢測。

在著名的人臉檢測器MTCNN中,使用圖像金字塔法檢測不同分辨率的人臉目標(biāo)。然而,這種方法通常是緩慢的,雖然構(gòu)建圖像金字塔可以使用卷積核分離加速或簡單粗暴地縮放,但仍需要做多個特征提取,后來有人借其想法想出一個特征金字塔網(wǎng)絡(luò)FPN,在不同層融合特征,只需要一次正向計算,不需要縮放圖片。它也被應(yīng)用于小目標(biāo)檢測,這將在后面的文章中討論。

簡單,粗暴和可靠的數(shù)據(jù)增強

通過增加訓(xùn)練集中小目標(biāo)樣本的種類和數(shù)量,也可以提高小目標(biāo)檢測的性能。有兩種簡單而粗糙的方法:

針對COCO數(shù)據(jù)集中含有小目標(biāo)的圖片數(shù)量較少的問題,使用過采樣策略:

31941d6e-a648-11eb-aece-12bb97331649.jpg

不同采樣比的實驗。我們觀察到,不管檢測小目標(biāo)的比率是多少,過采樣都有幫助。這個比例使我們能夠在大小物體之間做出權(quán)衡。

針對同一張圖片中小目標(biāo)數(shù)量少的問題,使用分割mask切出小目標(biāo)圖像,然后使用復(fù)制和粘貼方法(當(dāng)然,再加一些旋轉(zhuǎn)和縮放)。

通過復(fù)制粘貼小目標(biāo)來實現(xiàn)人工增強的例子。正如我們在這些例子中所觀察到的,粘貼在同一幅圖像上可以獲得正確的小目標(biāo)的周圍環(huán)境。

在Anchor策略方法中,如果同一幅圖中有更多的小目標(biāo),則會匹配更多的正樣本。

31b10384-a648-11eb-aece-12bb97331649.jpg

與ground truth物體相匹配的不同尺度anchor示意圖,小的目標(biāo)匹配到更少的anchor。為了克服這一問題,我們提出通過復(fù)制粘貼小目標(biāo)來人工增強圖像,使訓(xùn)練過程中有更多的anchor與小目標(biāo)匹配。

特征融合FPN

不同階段的特征圖對應(yīng)不同的感受野,其所表達(dá)的信息抽象程度也不同。

淺層特征圖感受野小,更適合檢測小目標(biāo),深層特征圖較大,更適合檢測大目標(biāo)。因此,有人提出將不同階段的特征映射整合在一起來提高目標(biāo)檢測性能,稱之為特征金字塔網(wǎng)絡(luò)FPN。

31cc7b5a-a648-11eb-aece-12bb97331649.jpg

(a)利用圖像金字塔建立特征金字塔。特征的計算是在每個圖像的尺度上獨立進(jìn)行的,這是很緩慢的。(b)最近的檢測系統(tǒng)選擇只使用單一尺度的特征以更快地檢測。另一種選擇是重用由ConvNet計算出的金字塔特征層次結(jié)構(gòu),就好像它是一個特征圖金字塔。(d)我們提出的特征金字塔網(wǎng)絡(luò)(FPN)與(b)和一樣快,但更準(zhǔn)確。在這個圖中,特征圖用藍(lán)色輪廓線表示,較粗的輪廓線表示語義上較強的特征。

由于可以通過融合不同分辨率的特征圖來提高特征的豐富度和信息含量來檢測不同大小的目標(biāo),自然會有人進(jìn)一步猜測,如果只檢測高分辨率的特征圖(淺層特征)來檢測小人臉,使用中分辨率特征圖(中間特征)來檢測大的臉。

31d8be38-a648-11eb-aece-12bb97331649.jpg

SSH的網(wǎng)絡(luò)結(jié)構(gòu)

合適的訓(xùn)練方法SNIP, SNIPER, SAN

機器學(xué)習(xí)中有一點很重要,模型預(yù)訓(xùn)練的分布應(yīng)該盡可能接近測試輸入的分布。因此,在大分辨率(如常見的224 x 224)下訓(xùn)練的模型不適合檢測小分辨率的圖像,然后放大并輸入到模型中。

如果輸入的是小分辨率的圖像,則在小分辨率的圖像上訓(xùn)練模型,如果沒有,則應(yīng)該先用大分辨率的圖片訓(xùn)練模型,然后再用小分辨率的圖片進(jìn)行微調(diào),最壞的情況是直接使用大分辨率的圖像來預(yù)測小分辨率的圖像(通過上采樣放大)。

因此,在實際應(yīng)用中,對輸入圖像進(jìn)行放大并進(jìn)行高速率的圖像預(yù)訓(xùn)練,然后對小圖像進(jìn)行微調(diào)比針對小目標(biāo)訓(xùn)練分類器效果更好。

3202a8ce-a648-11eb-aece-12bb97331649.jpg

所有的圖都報告了ImageNet分類數(shù)據(jù)集驗證集的準(zhǔn)確性。我們對48、64、80等分辨率的圖像進(jìn)行上采樣,在圖(a)中繪制出預(yù)訓(xùn)練的ResNet-101分類器的Top-1精度。圖(b、c)分別為原始圖像分辨率為48,96像素時不同cnn的結(jié)果。

更密集的Anchor采樣和匹配策略S3FD, FaceBoxes

如前面的數(shù)據(jù)增強部分所述,將一個小目標(biāo)復(fù)制到圖片中的多個位置,可以增加小目標(biāo)匹配的anchor數(shù)量,增加小目標(biāo)的訓(xùn)練權(quán)重,減少網(wǎng)絡(luò)對大目標(biāo)的偏置。同樣,在逆向思維中,如果數(shù)據(jù)集已經(jīng)確定,我們也可以增加負(fù)責(zé)小目標(biāo)的anchor的設(shè)置策略,使訓(xùn)練過程中對小目標(biāo)的學(xué)習(xí)更加充分。

例如,在FaceBoxes中,其中一個貢獻(xiàn)是anchor策略。

320c45dc-a648-11eb-aece-12bb97331649.jpg

Anchor變的密集例子。為了清晰起見,我們只對一個感受野中心(即中央黑色網(wǎng)格)密集化錨點,并只給對角錨點上色。

Anchor密集化策略,使不同類型的anchor在圖像上具有相同的密度,顯著提高小人臉的召回率。

總結(jié)

本文較詳細(xì)地總結(jié)了一般目標(biāo)檢測和特殊人臉檢測中常見的小目標(biāo)檢測解決方案。

英文原文:https://medium.datadriveninvestor.com/how-to-deal-with-small-objects-in-object-detection-44d28d136cbc

來源:AI公園

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 噪聲
    +關(guān)注

    關(guān)注

    13

    文章

    1140

    瀏覽量

    48147
  • 分辨率
    +關(guān)注

    關(guān)注

    2

    文章

    1080

    瀏覽量

    42655
  • 人臉檢測
    +關(guān)注

    關(guān)注

    0

    文章

    86

    瀏覽量

    16852

原文標(biāo)題:在目標(biāo)檢測中如何解決小目標(biāo)的問題?

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    氣密性檢測儀的核心應(yīng)用范疇及其所針對的檢測目標(biāo)

    工業(yè)生產(chǎn)與質(zhì)量控制領(lǐng)域,氣密性檢測儀是保障產(chǎn)品品質(zhì)與性能的關(guān)鍵設(shè)備。以下將圍繞氣密性檢測儀的核心應(yīng)用范疇及其所針對的檢測目標(biāo)展開介紹,以下
    的頭像 發(fā)表于 06-27 15:03 ?141次閱讀
    氣密性<b class='flag-5'>檢測</b>儀的核心應(yīng)用范疇及其所針對的<b class='flag-5'>檢測</b><b class='flag-5'>目標(biāo)</b>

    YOLOv8水果檢測示例代碼換成640輸入圖像出現(xiàn)目標(biāo)框繪制錯誤的原因 ?

    \",的best.kmodel替換為640輸入圖像,model_input_size=[640,640],就會出現(xiàn)目標(biāo)檢測目標(biāo)框位置混亂,目標(biāo)
    發(fā)表于 06-18 06:37

    基于LockAI視覺識別模塊:C++目標(biāo)檢測

    檢測是計算機視覺領(lǐng)域中的一個關(guān)鍵任務(wù),它不僅需要識別圖像存在哪些對象,還需要定位這些對象的位置。具體來說,目標(biāo)檢測算法會輸出每個檢測到的對
    發(fā)表于 06-06 14:43

    基于LockAI視覺識別模塊:C++目標(biāo)檢測

    本文檔基于瑞芯微RV1106的LockAI凌智視覺識別模塊,通過C++語言做的目標(biāo)檢測實驗。本文檔展示了如何使用lockzhiner_vision_module::PaddleDet類進(jìn)行目標(biāo)
    的頭像 發(fā)表于 06-06 13:56 ?219次閱讀
    基于LockAI視覺識別模塊:C++<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b>

    labview調(diào)用yolo目標(biāo)檢測、分割、分類、obb

    labview調(diào)用yolo目標(biāo)檢測、分割、分類、obb、pose深度學(xué)習(xí),支持CPU和GPU推理,32/64位labview均可使用。 (yolov5~yolov12)
    發(fā)表于 03-31 16:28

    軒轅智駕紅外目標(biāo)檢測算法汽車領(lǐng)域的應(yīng)用

    AI 技術(shù)蓬勃發(fā)展的當(dāng)下,目標(biāo)檢測算法取得了重大突破,其中紅外目標(biāo)檢測算法更是汽車行業(yè)掀起
    的頭像 發(fā)表于 03-27 15:55 ?429次閱讀

    16片ADS54J54多片如何同步,才能保證每個通道采集同一個目標(biāo)的數(shù)據(jù)一一對應(yīng)?

    16片ADS54J54多片如何同步,才能保證每個通道采集同一個目標(biāo)的數(shù)據(jù)一一對應(yīng)
    發(fā)表于 01-10 16:27

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測模型

    挑戰(zhàn)的方法。 2 目標(biāo)檢測模型介紹 目標(biāo)檢測的任務(wù),有著許許多多的模型,如 Picodet、
    發(fā)表于 12-19 14:33

    案例分享 ▏基于HZ-EVM-RK3576開發(fā)板實現(xiàn)YOLOv5目標(biāo)檢測應(yīng)用

    隨著人工智能技術(shù)的不斷進(jìn)步,目標(biāo)檢測已成為計算機視覺的核心任務(wù)之一,廣泛應(yīng)用于自動駕駛、安防監(jiān)控、工業(yè)自動化等領(lǐng)域。與此同時,隨著硬件性能的提升和邊緣計算需求的激增,開發(fā)者愈加傾向于選擇高性能
    的頭像 發(fā)表于 12-07 01:10 ?1661次閱讀
    案例分享 ▏基于HZ-EVM-RK3576開發(fā)板實現(xiàn)YOLOv5<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b>應(yīng)用

    淺談物聯(lián)網(wǎng)智能照明系統(tǒng)雙碳目標(biāo)下的研究與設(shè)計

    全球氣候變化和可持續(xù)發(fā)展目標(biāo)的背景下,智能照明系統(tǒng)成為了實現(xiàn)能耗監(jiān)測和助力雙碳目標(biāo)的關(guān)鍵工具。本文研究物聯(lián)網(wǎng)技術(shù)智能照明的應(yīng)用,探討了
    的頭像 發(fā)表于 11-22 15:19 ?640次閱讀
    淺談物聯(lián)網(wǎng)智能照明系統(tǒng)<b class='flag-5'>在</b>雙碳<b class='flag-5'>目標(biāo)</b>下的研究與設(shè)計

    YOLOv10自定義目標(biāo)檢測之理論+實踐

    保持先進(jìn)性能的同時,降低了計算需求。大量實驗表明,YOLOv10 各種模型規(guī)模上提供了更優(yōu)的準(zhǔn)確率-延遲權(quán)衡。 正如讀過我之前文章的朋友所知道的,我分享了使用 YOLO 模型的各種項目,因為預(yù)訓(xùn)練模型,YOLO 模型
    的頭像 發(fā)表于 11-16 10:23 ?1606次閱讀
    YOLOv10自定義<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b>之理論+實踐

    手把手教你如何自制目標(biāo)檢測框架

    今天,給大家分享一篇來自知乎的一篇關(guān)于目標(biāo)檢測相關(guān)的一些內(nèi)容, 本文基于Pytorch進(jìn)行編寫。
    的頭像 發(fā)表于 11-14 16:39 ?656次閱讀
    手把手教你如何自制<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b>框架

    樹莓派上部署YOLOv5進(jìn)行動物目標(biāo)檢測的完整流程

    目標(biāo)檢測計算機視覺領(lǐng)域中具有重要意義。YOLOv5(You Only Look One-level)是目標(biāo)檢測算法
    的頭像 發(fā)表于 11-11 10:38 ?3726次閱讀
    <b class='flag-5'>在</b>樹莓派上部署YOLOv5進(jìn)行動物<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b>的完整流程

    目標(biāo)檢測中大物體的重要性

    導(dǎo)讀實驗表明,對大型物體賦予更大的權(quán)重可以提高所有尺寸物體的檢測分?jǐn)?shù),從而整體提升目標(biāo)檢測器的性能(COCOval2017數(shù)據(jù)集上使用InternImage-T模型,小物體
    的頭像 發(fā)表于 10-09 08:05 ?821次閱讀
    <b class='flag-5'>在</b><b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b>中大物體的重要性

    智能化升級:機載無人機攝像頭如何自動識別目標(biāo)?

    機載無人機攝像頭智能化升級的過程,自動識別目標(biāo)的能力得到了顯著提升。這一過程涉及多個關(guān)鍵技術(shù)和算法,以下是關(guān)于機載無人機攝像頭如何自動識別目標(biāo)的詳細(xì)
    的頭像 發(fā)表于 09-19 15:23 ?1677次閱讀
    智能化升級:機載無人機攝像頭如何自動識別<b class='flag-5'>目標(biāo)</b>?