一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計(jì)算機(jī)視覺任務(wù)里常常會(huì)碰到類別不平衡的問題

新機(jī)器視覺 ? 來源:機(jī)器學(xué)習(xí)AI算法工程 ? 作者:機(jī)器學(xué)習(xí)AI算法工 ? 2022-06-13 11:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

計(jì)算機(jī)視覺(CV)任務(wù)里常常會(huì)碰到類別不平衡的問題, 例如:

1. 圖片分類任務(wù),有的類別圖片多,有的類別圖片少

2. 檢測任務(wù)?,F(xiàn)在的檢測方法如SSD和RCNN系列,都使用anchor機(jī)制。訓(xùn)練時(shí)正負(fù)anchor的比例很懸殊。

3. 分割任務(wù), 背景像素?cái)?shù)量通常遠(yuǎn)大于前景像素。

從實(shí)質(zhì)上來講, 它們可以歸類成分類問題中的類別不平衡問題:對圖片/anchor/像素的分類。

再者,除了類不平衡問題, 還有easy sample overwhelming的問題。easy sample如果太多,可能會(huì)將有效梯度稀釋掉。

這兩個(gè)問題通常都會(huì)一起出現(xiàn)。如果不處理, 可能會(huì)對模型性能造成很大傷害。用Focal Loss里的話說,就是訓(xùn)練不給力, 且會(huì)造成模型退化:

(1) training is inefficient as most locations are easy negatives…

(2) the easy negatives can overwhelming training and lead to degenerate models.

如果要處理,那么該怎么處理呢?在CV領(lǐng)域里, 若不考慮修改模型本身, 通常會(huì)在loss上做文章, 確切地說,是在樣本選擇或loss weight上做文章。

常見的解決辦法介紹

常見的方法有online的, 也有非online的;有只處理類間不平衡的,有只處理easy example的, 也有同時(shí)處理兩者的。

Hard Negative Mining, 非online的mining/boosting方法, 以‘古老’的RCNN(2014)為代表, 但在CV里現(xiàn)在應(yīng)該沒有人使用了(吧?)。若感興趣,推薦去看看OHEM論文里的related work部分。

Mini-batch Sampling,以Fast R-CNN(2015)和Faster R-CNN(2016)為代表。Fast RCNN在訓(xùn)練分類器, Faster R-CNN在訓(xùn)練RPN時(shí),都會(huì)從N = 1或2張圖片上隨機(jī)選取mini_batch_size/2個(gè)RoI或anchor, 使用正負(fù)樣本的比例為1:1。若正樣本數(shù)量不足就用負(fù)樣本填充。使用這種方法的人應(yīng)該也很少了。從這個(gè)方法開始, 包括后面列出的都是online的方法。

Online Hard Example Mining, OHEM(2016)。將所有sample根據(jù)當(dāng)前l(fā)oss排序,選出loss最大的N個(gè),其余的拋棄。這個(gè)方法就只處理了easy sample的問題。

Oline Hard Negative Mining, OHNM, SSD(2016)里使用的一個(gè)OHEM變種, 在Focal Loss里代號為OHEM 1:3。在計(jì)算loss時(shí), 使用所有的positive anchor, 使用OHEM選擇3倍于positive anchor的negative anchor。同時(shí)考慮了類間平衡與easy sample。

Class Balanced Loss。計(jì)算loss時(shí),正負(fù)樣本上的loss分別計(jì)算, 然后通過權(quán)重來平衡兩者。暫時(shí)沒找到是在哪提出來的,反正就這么被用起來了。它只考慮了類間平衡。

Focal Loss(2017), 最近提出來的。不會(huì)像OHEM那樣拋棄一部分樣本, 而是和Class Balance一樣考慮了每個(gè)樣本, 不同的是難易樣本上的loss權(quán)重是根據(jù)樣本難度計(jì)算出來的。

從更廣義的角度來看,這些方法都是在計(jì)算loss時(shí)通過給樣本加權(quán)重來解決不平衡與easy example的問題。不同的是,OHEM使用了hard weight(只有0或1),而Focal Loss使用了soft weight(0到1之間)。

現(xiàn)在依然常用的方法特性比較如下:

458cebe2-ea59-11ec-ba43-dac502259ad0.png

接下來, 通過修改過的Cifar數(shù)據(jù)集來比較這幾種方法在分類任務(wù)上的表現(xiàn),當(dāng)然, 主要還是期待Focal Loss的表現(xiàn)。

實(shí)驗(yàn)數(shù)據(jù)

實(shí)驗(yàn)數(shù)據(jù)集

Cifar-10, Cifar-100。使用Cifar的原因沒有別的, 就因?yàn)楦F,畢竟要像Focal Loss論文里那樣跑那么多的大實(shí)驗(yàn)對大部分學(xué)校和企業(yè)來說是不現(xiàn)實(shí)的。

處理數(shù)據(jù)得到類間不平衡

將多分類任務(wù)轉(zhuǎn)換成二分類:

new_label = label == 1

原始Cifar-10和100里有很多類別,每類圖片的數(shù)量基本一樣。按照這種方式轉(zhuǎn)變后,多分類變成了二分類, 且正負(fù)樣本比例相差懸殊:9倍和99倍。

實(shí)驗(yàn)?zāi)P?/p>

一個(gè)5層的CNN,完成一個(gè)不平衡的二分類任務(wù)。使用Cross Entropy Loss,按照不同的方法使用不同的權(quán)值方案。以不加任何權(quán)重的CE Loss作為baseline。

衡量方式

在這種不平衡的二分類問題里, 準(zhǔn)確率已經(jīng)不適合用來衡量模型的好與壞了。此處使用F-Score作標(biāo)準(zhǔn)。

實(shí)現(xiàn)細(xì)節(jié)

CE(Cross Entroy Loss)

45ba2f1c-ea59-11ec-ba43-dac502259ad0.png

OHEM

分為以下三步:

1. 計(jì)算ce_loss, 同CE

2. 根據(jù)ce_loss排序, 選出top N 個(gè)sample:

45f341c6-ea59-11ec-ba43-dac502259ad0.png

4656a9a0-ea59-11ec-ba43-dac502259ad0.png

Class Balance CE

形式多種多樣,我個(gè)人最喜歡使用:

4692d3a8-ea59-11ec-ba43-dac502259ad0.png

46c6a868-ea59-11ec-ba43-dac502259ad0.png

46f254d6-ea59-11ec-ba43-dac502259ad0.png

優(yōu)化方法

最簡單的SGD, 初始lr=0.1, 每200,000步衰減一次, 衰減系數(shù)為0.1。Cifar-100上focal_loss的初始lr=0.01。

batch_size = 128.

實(shí)驗(yàn)結(jié)果

CIFAR-10:

473441d4-ea59-11ec-ba43-dac502259ad0.png

47621ea6-ea59-11ec-ba43-dac502259ad0.png

Focal Loss的一個(gè)補(bǔ)丁

對于CIFAR-100,batch_size=128時(shí), 一個(gè)batch內(nèi)可能會(huì)一個(gè)positive sample都沒有, 即n_pos == 0, 這時(shí),paper里用n_pos來normalize loss 的方式就不可行了。測試過兩種簡單的選擇:一是用所有weight之和來normalize, 二是直接不normalize。前者很難訓(xùn)練甚至訓(xùn)練不出來, 后者可用。所以上面的Focal loss計(jì)算代碼應(yīng)該補(bǔ)充為:

478de338-ea59-11ec-ba43-dac502259ad0.png

經(jīng)驗(yàn)總結(jié)

47e05fc8-ea59-11ec-ba43-dac502259ad0.png

Code Available On Github

https://github.com/dengdan/test_tf_models

Branch:focal_loss

References Focal Loss for Dense Object Detection, https://arxiv.org/pdf/1708.02002.pdf

RCNN, https://arxiv.org/abs/1311.2524

Fast RCNN, http://arxiv.org/abs/1504.08083

Faster-RCNN, http://arxiv.org/abs/1506.01497

Training Region-based Object Detectors with Online Hard Example Mining, https://arxiv.org/abs/1604.03540

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • CV
    CV
    +關(guān)注

    關(guān)注

    0

    文章

    53

    瀏覽量

    17152
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1709

    瀏覽量

    46786
  • 檢測方法
    +關(guān)注

    關(guān)注

    0

    文章

    50

    瀏覽量

    9973

原文標(biāo)題:視覺分類任務(wù)中處理不平衡問題的loss比較

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    無軸承異步電機(jī)的不平衡振動(dòng)補(bǔ)償控制

    針對由質(zhì)量偏心引起的無軸承異步電機(jī)轉(zhuǎn)子不平衡振動(dòng)問題,首先對不平衡振動(dòng)的產(chǎn)生機(jī)理進(jìn)行了分析;然后,研究給出了無軸承磁懸浮轉(zhuǎn)子的不平衡振動(dòng)位移提取算法、不平衡振動(dòng)前饋補(bǔ)償控制力的實(shí)時(shí)估算
    發(fā)表于 07-14 17:37

    輪轂電機(jī)不平衡電磁力對車輪定位參數(shù)的影響

    [摘要] 輪轂電機(jī)驅(qū)動(dòng)電動(dòng)汽車將電機(jī)、減速機(jī)構(gòu)和制動(dòng)器等高度集成于車輪內(nèi)。不同路面激勵(lì)下的輪胎跳動(dòng)、載荷不均和軸承磨損等造成電機(jī)氣隙沿圓周分布不均,其所產(chǎn)生的不平衡電磁力將會(huì)通過減速機(jī)構(gòu)或直接傳遞
    發(fā)表于 06-10 13:17

    B0430J50100AHF超小型不平衡轉(zhuǎn)平衡變壓器

    B0430J50100AHF超小型不平衡轉(zhuǎn)平衡變壓器B0430J50100AHF是Anaren推出的一款超小型、低成本且低輪廓的不平衡轉(zhuǎn)平衡變壓器,專為滿足新一代A/D和D/A轉(zhuǎn)換器I
    發(fā)表于 02-08 09:26

    平衡電阻器可以改為不平衡

    在電子電路中,平衡電阻器與不平衡電阻器各自扮演著重要的角色。平衡電阻器主要用于實(shí)現(xiàn)電路的平衡和穩(wěn)定性,減少噪音和干擾,提高信號質(zhì)量。而不平衡
    的頭像 發(fā)表于 01-30 14:31 ?1186次閱讀

    單元不平衡永久故障閾值的單元類型特定設(shè)置

    電子發(fā)燒友網(wǎng)站提供《單元不平衡永久故障閾值的單元類型特定設(shè)置.pdf》資料免費(fèi)下載
    發(fā)表于 10-18 11:21 ?0次下載
    單元<b class='flag-5'>不平衡</b>永久故障閾值的單元類型特定設(shè)置

    電容器不平衡保護(hù)動(dòng)作原因分析

    電容器不平衡保護(hù)動(dòng)作的原因多種多樣,主要包括以下幾個(gè)方面: 1. 電容器組內(nèi)部故障 電容量不平衡 :電容器組中的電容器由于老化、損壞或制造差異,可能導(dǎo)致三相電容量不平衡。當(dāng)三相之間電容值差異較大
    的頭像 發(fā)表于 09-20 15:43 ?2726次閱讀

    電橋電路不平衡時(shí)是什么電路

    電橋電路是一種測量電阻的電路,它利用了惠斯通電橋的原理。當(dāng)電橋電路不平衡時(shí),它是一種具有特定特性的電路,這種特性可以用于測量電阻、電容、電感等元件的參數(shù)。 電橋電路的基本原理 電橋電路是一種由四個(gè)
    的頭像 發(fā)表于 08-27 14:31 ?1826次閱讀

    LCR測試儀如何測量不平衡度?

    在電路設(shè)計(jì)和維修中,了解電路元件的特性是非常重要的。LCR測試儀就是一種常用的檢測儀器,它可以測量電感(L)、電容(C)和電阻(R)的參數(shù)。其中,測量不平衡度是LCR測試儀的一項(xiàng)重要功能。那么
    的頭像 發(fā)表于 08-26 16:49 ?1047次閱讀
    LCR測試儀如何測量<b class='flag-5'>不平衡</b>度?

    計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)

    計(jì)算機(jī)視覺作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動(dòng)了多個(gè)行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時(shí)也伴隨著一些挑戰(zhàn)和局限性。以下是對
    的頭像 發(fā)表于 08-14 09:49 ?2061次閱讀

    電容電壓分配不平衡的影響

    電容電壓分配不平衡(也稱為電容器電壓不均衡)在電力系統(tǒng)中可能會(huì)產(chǎn)生多種負(fù)面影響,具體包括以下幾點(diǎn): 1、過壓導(dǎo)致的電容器損壞 電壓不平衡會(huì)導(dǎo)致某些電容器承受過高的電壓,超過其額定值。這種過壓可能會(huì)
    的頭像 發(fā)表于 08-09 14:15 ?1651次閱讀
    電容電壓分配<b class='flag-5'>不平衡</b>的影響

    三相電流不平衡對電壓影響大嗎

    在現(xiàn)代電力系統(tǒng)中,三相交流電是最常見的供電方式。三相電流平衡是保證電力系統(tǒng)穩(wěn)定運(yùn)行的關(guān)鍵因素之一。然而,由于多種原因,三相電流可能會(huì)出現(xiàn)不平衡現(xiàn)象,這對電力系統(tǒng)的電壓穩(wěn)定性和設(shè)備的正常運(yùn)行
    的頭像 發(fā)表于 07-25 16:28 ?2748次閱讀

    三相負(fù)載不平衡會(huì)引起零序電流嗎

    會(huì)。三相負(fù)載不平衡是指在三相電力系統(tǒng)中,三個(gè)相的負(fù)載電流不相等。這種情況在實(shí)際應(yīng)用中是比較常見的,比如在工業(yè)生產(chǎn)、民用建筑等場合。三相負(fù)載不平衡會(huì)引起一系列的問題,其中之一就是零序電流的產(chǎn)生。 一
    的頭像 發(fā)表于 07-25 16:26 ?2630次閱讀

    不平衡電流和零序電流的區(qū)別是什么

    在電力系統(tǒng)中,電流的平衡不平衡是影響電力系統(tǒng)穩(wěn)定性和安全性的重要因素。不平衡電流和零序電流是兩種常見的電流類型,它們在電力系統(tǒng)中扮演著不同的角色。 一、定義 不平衡電流 是指三相電力
    的頭像 發(fā)表于 07-25 16:24 ?3738次閱讀

    三相電流不平衡會(huì)產(chǎn)生零序電流嗎

    會(huì)產(chǎn)生。在電力系統(tǒng)中,三相電流不平衡是一個(gè)常見的問題,它會(huì)導(dǎo)致許多不良后果,如設(shè)備過熱、效率降低、電能損耗增加等。而零序電流則是電力系統(tǒng)中一種特殊的電流形式,它與三相電流不平衡有著密切的關(guān)系。 一
    的頭像 發(fā)表于 07-25 16:22 ?2792次閱讀

    計(jì)算機(jī)視覺技術(shù)的AI算法模型

    計(jì)算機(jī)視覺技術(shù)作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實(shí)現(xiàn)這一目標(biāo),計(jì)算機(jī)視覺技術(shù)依賴于
    的頭像 發(fā)表于 07-24 12:46 ?1822次閱讀