一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一篇看懂圖像分類基礎(chǔ)知識(shí)

新機(jī)器視覺 ? 來源:新機(jī)器視覺 ? 2023-02-10 15:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

?

基礎(chǔ)知識(shí)

1.具體領(lǐng)域劃分

(1)多類別圖像分類

(2)細(xì)粒度圖像分類

(3)多標(biāo)簽圖像分類

(4)弱監(jiān)督與無監(jiān)督圖像分類

(5)零樣本圖像分類

2.圖像分類問題的3層境界

fa75dddc-a90f-11ed-bfe3-dac502259ad0.png

多類別圖像分類在不同物種的層次上識(shí)別,往往具有較大的類間方差,而類內(nèi)則具有較小的類內(nèi)誤差。

fab804f0-a90f-11ed-bfe3-dac502259ad0.png

細(xì)粒度圖像分類具有更加相似的外觀和特征,導(dǎo)致數(shù)據(jù)間的類內(nèi)差異較大,分類難度也更高。

fae5327c-a90f-11ed-bfe3-dac502259ad0.png

實(shí)例級(jí)分類可以看做是一個(gè)識(shí)別問題,比如人臉識(shí)別。

fb0e6cfa-a90f-11ed-bfe3-dac502259ad0.png

3.傳統(tǒng)圖像分類關(guān)鍵問題

(1)數(shù)據(jù)預(yù)處理 (2)圖像特征 (3)分類模型

分為兩種: 手工特征+分類器、從數(shù)據(jù)自動(dòng)學(xué)習(xí)特征

fb2d4a8a-a90f-11ed-bfe3-dac502259ad0.png

4.常用的圖像分類數(shù)據(jù)集

(1) MNIST數(shù)據(jù)集:

發(fā)布于1998年,60000張圖,10類,分布均勻,數(shù)據(jù)集中的”hello world”

fb421f28-a90f-11ed-bfe3-dac502259ad0.png

在票據(jù)等圖像中裁剪出數(shù)字,將其放在20 * 20像素的框中,并保持了長(zhǎng)寬比率,然后放在28* 28的背景中。

(2) CIFAR10

MNIST的彩色增強(qiáng)版,60000張圖片,大小32 * 32,10類,均勻分布,都是真實(shí)圖片而不是手稿等,圖中只有一個(gè)主體目標(biāo),可以有部分遮擋,但是必須可辨識(shí)。

fb54644e-a90f-11ed-bfe3-dac502259ad0.png

(3) CIFAR100

更加細(xì)粒度的CIFAR10,共100類,被分成20個(gè)超類。

每小類包含600個(gè)圖像,其中有500個(gè)訓(xùn)練圖像和100個(gè)測(cè)試圖像。每個(gè)圖像都帶有一個(gè)“精細(xì)”標(biāo)簽(它所屬的類)和一個(gè)粗糙的標(biāo)簽(它所屬的超類)

fb8e3412-a90f-11ed-bfe3-dac502259ad0.pngfba073c0-a90f-11ed-bfe3-dac502259ad0.png

(4) PASCAL

來源于2005-2012的PASCAL Visual Object Classes(VOC項(xiàng)目),20類,來源于圖片社交網(wǎng)站flickr,總共9963張圖,24640個(gè)標(biāo)注目標(biāo)。

fbbec0f0-a90f-11ed-bfe3-dac502259ad0.png

2005年主要用于目標(biāo)檢測(cè),從2007年開始引進(jìn)了圖像分割的標(biāo)注和人體結(jié)構(gòu)布局的標(biāo)注,2010年開始引進(jìn)了行為分類標(biāo)注。

fbe2051a-a90f-11ed-bfe3-dac502259ad0.png

(5)ImageNet數(shù)據(jù)集

包含21841個(gè)類別,14197122張圖片,百萬標(biāo)注框

fc2a1620-a90f-11ed-bfe3-dac502259ad0.png

5 評(píng)估指標(biāo)

(1)正負(fù)樣本

計(jì)標(biāo)簽為正樣本,分類為正樣本的數(shù)目為True Positive,簡(jiǎn)稱TP,標(biāo)簽為正樣本,分類為負(fù)樣本的數(shù)目為「False Negative」,簡(jiǎn)稱FN,標(biāo)簽為負(fù)樣本,分類為正樣本的數(shù)目為「False Positive」,簡(jiǎn)稱FP,標(biāo)簽為負(fù)樣本,分類為負(fù)樣本的數(shù)目為「True Negative」,簡(jiǎn)稱TN。

fc5070d6-a90f-11ed-bfe3-dac502259ad0.png

(2)精確率、召回率、F1值

精度(查準(zhǔn)率): 被判定為正樣本的測(cè)試樣本中,真正的正樣本所占的比例

fc67a724-a90f-11ed-bfe3-dac502259ad0.png

召回率(查全率): 被判定為正樣本的正樣本占全部正樣本的比例

fc78e3fe-a90f-11ed-bfe3-dac502259ad0.png

F1-score是綜合考慮了精度與召回率,其值越大模型越好。

fc862ea6-a90f-11ed-bfe3-dac502259ad0.png

(3)PR曲線

精度與召回率是一對(duì)相互矛盾的指標(biāo),召回率增加,精度下降,曲線與坐標(biāo)值面積越大,性能越好,對(duì)正負(fù)樣本不均衡敏感。

fc96e91c-a90f-11ed-bfe3-dac502259ad0.png

(4)ROC曲線與AUC

fca523ec-a90f-11ed-bfe3-dac502259ad0.png

橫坐標(biāo)(假陽率)FPR=FP/(FR+TN) 正類中實(shí)際負(fù)實(shí)例占所有負(fù)實(shí)例的比例。

縱坐標(biāo)(正陽率) TPR=TP/(TP+FN) 正類中實(shí)際正實(shí)例占所有正實(shí)例的比例。

正負(fù)樣本的分布變化,ROC曲線保持不變,對(duì)正負(fù)樣本不均衡問題不敏感。

AUC(Area Under Curve): ROC曲線下的面積,表示隨機(jī)挑選一個(gè)正樣本以及一個(gè)負(fù)樣本,分類器會(huì)對(duì)正樣本給出的預(yù)測(cè)值高于負(fù)樣本的概率。

(5)混淆矩陣

多矩陣分類模型各個(gè)類別之間的分類情況。

對(duì)于k分類問題,混淆矩陣為k*k的矩陣,元素Cij表示第i類樣本被分類器判定為第j類的數(shù)量。

fcba9bfa-a90f-11ed-bfe3-dac502259ad0.png

主對(duì)角線的元素之和為正確分類的樣本數(shù),其他位置元素之和為錯(cuò)誤分類的樣本數(shù)。對(duì)角線之和值越大,正確率越高。

混淆矩陣可以很清晰的反映出各類別之間的錯(cuò)分概率,越好的分類器對(duì)角線上的值更大。

fcccaa66-a90f-11ed-bfe3-dac502259ad0.png

(6)0-1損失

只看分類的對(duì)錯(cuò),當(dāng)標(biāo)簽與與類別相等時(shí),loss為0,否則為1。

fcf9e814-a90f-11ed-bfe3-dac502259ad0.png

這個(gè)是真實(shí)的優(yōu)化目標(biāo),但是無法求導(dǎo)和優(yōu)化,只有理論意義。

(7)熵與交叉熵(cross entropy)

熵表示熱力學(xué)系統(tǒng)的無序程序,在信息學(xué)中用于表示信息多少,不確定性越大,概率越低,則信息越多,熵越高。

fd0be9f6-a90f-11ed-bfe3-dac502259ad0.png

熵是概率的單調(diào)遞減的函數(shù)。

fd26764a-a90f-11ed-bfe3-dac502259ad0.png

(8)KL散度

用于估計(jì)兩個(gè)分布p和q的相似性

fd380888-a90f-11ed-bfe3-dac502259ad0.png

如果p是一個(gè)已知的分布(標(biāo)簽),則-l(p,p)是一個(gè)常數(shù),此時(shí)KL散度與交叉熵l(p,q)只有一個(gè)常數(shù)的差異。

KL散度的特性是大于等于0,當(dāng)且僅當(dāng)兩個(gè)分布完全相同時(shí)等于0。

fd47ab58-a90f-11ed-bfe3-dac502259ad0.png

審核編輯 :李倩


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3516

    瀏覽量

    50343
  • 圖像分類
    +關(guān)注

    關(guān)注

    0

    文章

    96

    瀏覽量

    12156
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1223

    瀏覽量

    25405

原文標(biāo)題:小白必讀!一篇看懂圖像分類基礎(chǔ)知識(shí)

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    鴻蒙移植必備的基礎(chǔ)知識(shí)

    的腳本:腳本就是把命令寫在個(gè)文件里MakefileGCC編譯命令1.3 芯片相關(guān)知識(shí)能閱讀芯片手冊(cè)(英文)移植最小系統(tǒng)時(shí),涉及的手冊(cè)內(nèi)容不多能看懂硬件原理圖移植最小系統(tǒng)時(shí),涉及的原理圖內(nèi)容不多2. 驅(qū)動(dòng)程序
    發(fā)表于 07-01 06:35

    鐵的基礎(chǔ)知識(shí)及鐵的分類

    鐵的基礎(chǔ)知識(shí)及鐵的分類 生鐵是指把鐵礦石4放到高爐中冶煉5而成的產(chǎn)品,也叫“銑鐵”。生鐵是高爐產(chǎn)品,可分為6普通生鐵和合金生
    發(fā)表于 12-24 11:16 ?1.5w次閱讀
    鐵的<b class='flag-5'>基礎(chǔ)知識(shí)</b>及鐵的<b class='flag-5'>分類</b>

    電感基礎(chǔ)知識(shí)大全

    電感基礎(chǔ)知識(shí)大全 電感的分類按 電感形式 分類:固定電感、可變電感。按導(dǎo)磁體性質(zhì)分類:空芯線圈、鐵氧體線圈
    發(fā)表于 07-29 19:05 ?6475次閱讀
    電感<b class='flag-5'>基礎(chǔ)知識(shí)</b>大全

    半導(dǎo)體基礎(chǔ)知識(shí)(詳細(xì)

    半導(dǎo)體基礎(chǔ)知識(shí)(詳細(xì)) 2.1.1 概念   根據(jù)物體導(dǎo)電能力(電阻率)的不同,來劃分導(dǎo)體、絕緣體和半導(dǎo)體。 1.
    發(fā)表于 11-09 16:06 ?3w次閱讀
    半導(dǎo)體<b class='flag-5'>基礎(chǔ)知識(shí)</b>(詳細(xì)<b class='flag-5'>篇</b>)

    HIFI耳機(jī)基礎(chǔ)知識(shí)入門

    HIFI耳機(jī)基礎(chǔ)知識(shí)入門 、耳機(jī)是如何分類的? 1、按換能原理(Transducer)分
    發(fā)表于 02-02 11:48 ?3203次閱讀

    電源的分類和相關(guān)基礎(chǔ)知識(shí)

    電源的分類和相關(guān)基礎(chǔ)知識(shí) 1、交流穩(wěn)壓電源的分類及其特點(diǎn):
    發(fā)表于 03-08 10:03 ?557次閱讀

    FPGA開發(fā)經(jīng)驗(yàn)與技巧_基礎(chǔ)知識(shí)學(xué)習(xí)(1)

    FLC1301T00 基礎(chǔ)知識(shí)學(xué)習(xí)希望會(huì)對(duì)朋友們的學(xué)習(xí)有幫助!
    發(fā)表于 12-16 15:27 ?3次下載

    電阻基礎(chǔ)知識(shí)

    電阻基礎(chǔ)知識(shí)比較詳細(xì),分類清楚,適合初學(xué)者有個(gè)比較全面的了解
    發(fā)表于 01-11 14:55 ?0次下載

    手機(jī)基礎(chǔ)知識(shí)--維修

    手機(jī)基礎(chǔ)知識(shí)--維修。都是些簡(jiǎn)單的手機(jī)維修方面的東西,希望對(duì)大家有所幫助。
    發(fā)表于 06-20 16:09 ?13次下載

    三菱PLC分類及型號(hào)的基礎(chǔ)知識(shí)

    三菱PLC分類及型號(hào)的基礎(chǔ)知識(shí)
    發(fā)表于 01-02 16:20 ?2次下載

    117電子基礎(chǔ)知識(shí)文章大全

    本文檔的主要內(nèi)容詳細(xì)介紹的是117電子基礎(chǔ)知識(shí)文章大全。包括了:74系列集成電路的分類及區(qū)別,CMOS集成電路的工作原理,LED數(shù)碼管的識(shí)別,MOS場(chǎng)效應(yīng)管,PTC元件簡(jiǎn)介,TTL與COMS的區(qū)別,TL431的簡(jiǎn)介,保險(xiǎn)絲的基
    發(fā)表于 06-02 08:00 ?7次下載
    117<b class='flag-5'>篇</b>電子<b class='flag-5'>基礎(chǔ)知識(shí)</b>文章大全

    了解下機(jī)器學(xué)習(xí)中的基礎(chǔ)知識(shí)

    ,那么機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)都有哪些呢?本文給大家列舉下機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)。 (1)準(zhǔn)確率的概念,準(zhǔn)確率就是分類模型預(yù)測(cè)準(zhǔn)確的比例。 (2)AUC(曲線下面積)則是
    的頭像 發(fā)表于 03-31 17:08 ?4097次閱讀

    開關(guān)電源基礎(chǔ)知識(shí)

    開關(guān)電源基礎(chǔ)知識(shí)(核達(dá)中遠(yuǎn)通電源技術(shù)有限公司上市)-介紹了開關(guān)電源、基礎(chǔ)知識(shí)、分類與調(diào)制方式
    發(fā)表于 09-29 11:00 ?66次下載
    開關(guān)電源<b class='flag-5'>基礎(chǔ)知識(shí)</b>

    圖像處理基礎(chǔ)知識(shí)及OpenCV入門函數(shù)

    圖像基礎(chǔ)知識(shí)** 圖像都是由像素(pixel)構(gòu)成的,即圖像中的小方格,這些小方格都有個(gè)明確的位置和被分配的色彩數(shù)值,而這些
    的頭像 發(fā)表于 02-08 15:57 ?1202次閱讀
    <b class='flag-5'>圖像</b>處理<b class='flag-5'>基礎(chǔ)知識(shí)</b>及OpenCV入門函數(shù)

    圖像處理基礎(chǔ)知識(shí) 1

    直都在這里分享計(jì)算機(jī)基礎(chǔ)知識(shí),比如計(jì)算機(jī)組成原理、數(shù)據(jù)結(jié)構(gòu)與算法、計(jì)算機(jī)網(wǎng)絡(luò)和操作系統(tǒng)等。 不過偶爾我也想寫下其他的話題,今天就想和你聊聊圖像處理的相關(guān)
    的頭像 發(fā)表于 02-08 17:08 ?1097次閱讀
    <b class='flag-5'>圖像</b>處理<b class='flag-5'>基礎(chǔ)知識(shí)</b> 1