一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CNN根本無(wú)需理解圖像全局結(jié)構(gòu),一樣也能SOTA?

OpenCV學(xué)堂 ? 來(lái)源:量子位 ? 作者:量子位 ? 2022-06-09 10:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

不給全圖,只投喂CNN一些看上去毫無(wú)信息量的圖像碎片,就能讓模型學(xué)會(huì)圖像分類(lèi)。

更重要的是,性能完全不差,甚至還能反超用完整圖像訓(xùn)練的模型。

796d0e56-e739-11ec-ba43-dac502259ad0.png

這么一項(xiàng)來(lái)自加州大學(xué)圣塔芭芭拉分校的新研究,這兩天引發(fā)不少討論。

咋地,這就是說(shuō),CNN根本無(wú)需理解圖像全局結(jié)構(gòu),一樣也能SOTA?

79a3bafa-e739-11ec-ba43-dac502259ad0.png

具體是怎么一回事,咱們還是直接上論文。

實(shí)驗(yàn)證據(jù)

研究人員設(shè)計(jì)了這樣一個(gè)實(shí)驗(yàn):

他們?cè)贑IFAR-10、CIFAR-100、STL-10、Tiny-ImageNet-200以及Imagenet-1K等數(shù)據(jù)集上訓(xùn)練ResNet。

特別的是,用于訓(xùn)練的圖像是通過(guò)隨機(jī)裁剪得到的。

這個(gè)“隨機(jī)裁剪”,可不是往常我們會(huì)在數(shù)據(jù)增強(qiáng)方法中見(jiàn)到的那一種,而是完全不做任何填充。

舉個(gè)例子,就是對(duì)圖片做PyTorch的RandomCrop變換時(shí),padding的參數(shù)填0。

得到的訓(xùn)練圖像就是下面這個(gè)樣式的。即使你是閱圖無(wú)數(shù)的老司機(jī),恐怕也分辨不出到底是個(gè)啥玩意兒。

79d0c3ce-e739-11ec-ba43-dac502259ad0.png

訓(xùn)練圖像如此碎片化,模型的識(shí)圖能力又能達(dá)到幾成?

來(lái)看實(shí)驗(yàn)結(jié)果:

79edc60e-e739-11ec-ba43-dac502259ad0.png

好家伙,在CIFAR-10上,用16×16的圖像碎片訓(xùn)練出來(lái)的模型,測(cè)試準(zhǔn)確率能達(dá)到91%,而用完整的32×32尺寸圖像訓(xùn)練出來(lái)的模型,測(cè)試準(zhǔn)確率也不過(guò)90%。

這一波,“殘缺版”CNN竟然完全不落下風(fēng),甚至還反超了“完整版”CNN。

要知道,被喂了碎片的CNN模型,看到的圖像甚至可能跟標(biāo)簽顯示的物體毫無(wú)關(guān)系,只是原圖中背景的部分……

在STL-10、Tiny-Imagenet-200等數(shù)據(jù)集上,研究人員也得到了類(lèi)似的結(jié)果。

不過(guò),在CIFAR-100上,還是完整圖像訓(xùn)練出來(lái)的模型略勝一籌。16×16圖像碎片訓(xùn)練出的模型測(cè)試準(zhǔn)確率為61%,而32×32完整圖像訓(xùn)練出的模型準(zhǔn)確率為68%。

所以,CNN為何會(huì)有如此表現(xiàn)?莫非它本來(lái)就是個(gè)“近視眼”?

研究人員推測(cè),CNN能有如此優(yōu)秀的泛化表現(xiàn),是因?yàn)樵谶@個(gè)實(shí)驗(yàn)中,維度詛咒的影響被削弱了。

所謂維度詛咒(curse of dimensionality),是指當(dāng)維數(shù)提高時(shí),空間體積提高太快,導(dǎo)致可用數(shù)據(jù)變得稀疏。

而在這項(xiàng)研究中,由于CNN學(xué)習(xí)到的不是整個(gè)圖像的標(biāo)簽,而是圖像碎片的標(biāo)簽,這就在兩個(gè)方面降低了維度詛咒的影響:

圖像碎片的像素比完整圖像小得多,這減少了輸入維度

訓(xùn)練期間可用的樣本數(shù)量增加了

生成熱圖

基于以上實(shí)驗(yàn)觀察結(jié)果,研究人員還提出以熱圖的形式,來(lái)理解CNN的預(yù)測(cè)行為,由此進(jìn)一步對(duì)模型的錯(cuò)誤做出“診斷”。

就像這樣:

7a1871ce-e739-11ec-ba43-dac502259ad0.png

這些圖像來(lái)自于STL-10數(shù)據(jù)集。熱圖顯示,對(duì)于CNN而言,飛機(jī)圖像中最能“刺激”到模型的,不是飛機(jī)本身,而是天空。

同樣,在汽車(chē)圖像中,車(chē)輪才是CNN用來(lái)識(shí)別圖像的主要屬性。

論文地址: https://arxiv.org/abs/2205.10760

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像分類(lèi)
    +關(guān)注

    關(guān)注

    0

    文章

    96

    瀏覽量

    12168
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25448
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    354

    瀏覽量

    22742

原文標(biāo)題:不看全圖看局部,CNN性能竟然更強(qiáng)了

文章出處:【微信號(hào):CVSCHOOL,微信公眾號(hào):OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    圖像采集卡和顯卡是一樣的嗎?從核心差異、工作原理與應(yīng)用全解析

    不少朋友在做系統(tǒng)集成或設(shè)備選型時(shí),經(jīng)常會(huì)問(wèn)個(gè)看似簡(jiǎn)單但又容易混淆的問(wèn)題:圖像采集卡和顯卡一樣嗎?個(gè)是“采圖”的,個(gè)是“顯圖”的,聽(tīng)起來(lái)
    的頭像 發(fā)表于 05-14 09:52 ?343次閱讀
    <b class='flag-5'>圖像</b>采集卡和顯卡是<b class='flag-5'>一樣</b>的嗎?從核心差異、工作原理與應(yīng)用全解析

    貼片電容和瓷片電容一樣嗎?

    貼片電容和瓷片電容并不完全一樣,它們?cè)?b class='flag-5'>結(jié)構(gòu)、材料、特點(diǎn)和應(yīng)用等方面存在些差異。以下是對(duì)這兩種電容器的詳細(xì)比較: 、結(jié)構(gòu)差異 貼片電容:
    的頭像 發(fā)表于 04-30 15:05 ?261次閱讀
    貼片電容和瓷片電容<b class='flag-5'>一樣</b>嗎?

    Stm32CubeIDE像Keil一樣指定不同文件下的代碼編譯到不同的FLASH地址嗎?

    Stm32CubeIDE像Keil一樣指定不同文件下的代碼編譯到不同的FLASH地址嗎?比如部分代碼存放到內(nèi)部FLASH,另部分存放到外部QSPI的FLASH中
    發(fā)表于 03-07 08:09

    為什么要費(fèi)這么大勁讓機(jī)器人像人一樣,而不是更實(shí)用的形態(tài)?

    基礎(chǔ)設(shè)施兼容性 :人類(lèi)社會(huì)的物理環(huán)境(樓梯、門(mén)把手、工具、家具等)是為人體結(jié)構(gòu)和動(dòng)作設(shè)計(jì)的。人形機(jī)器人更容易直接融入這些環(huán)境,無(wú)需大規(guī)模改造基礎(chǔ)設(shè)施。 操作便利性 :人形機(jī)器人可以像人類(lèi)一樣使用工具、開(kāi)關(guān)門(mén)、搬運(yùn)物
    的頭像 發(fā)表于 02-10 10:03 ?400次閱讀

    調(diào)試THS8200時(shí)圖像正常輸出,但是圖像很模糊不清怎么解決?

    我們?cè)谡{(diào)試THS8200時(shí)圖像正常輸出,但是圖像很模糊不清,跟原來(lái)圖像相比差太遠(yuǎn)了,您們提供
    發(fā)表于 01-17 07:18

    Mamba入局圖像復(fù)原,達(dá)成新SOTA

    MambaIRv2,更高性能、更高效率!另外還有ACM MM 2024上的Freqmamba方法,在圖像去雨任務(wù)中取得了SOTA性能! 顯然,這種基于Mamba的方法在圖像復(fù)原領(lǐng)域,比基于CN
    的頭像 發(fā)表于 12-30 18:09 ?849次閱讀
    Mamba入局<b class='flag-5'>圖像</b>復(fù)原,達(dá)成新<b class='flag-5'>SOTA</b>

    SN65DPHY440SS 4組數(shù)據(jù)輸入輸出的內(nèi)部結(jié)構(gòu)是否一樣

    SN65DPHY440SS 4組數(shù)據(jù)輸入輸出的內(nèi)部結(jié)構(gòu)是否一樣?差分對(duì)P和N能否交換位置? 差分對(duì)順序能否能夠調(diào)整?如圖
    發(fā)表于 12-13 06:00

    直線(xiàn)電機(jī)的精度達(dá)到多少?和重復(fù)定位精度一樣

    電機(jī)定位精度和重復(fù)定位精度一樣嗎?下面來(lái)了解下直線(xiàn)電機(jī)定位精度和重復(fù)定位精度的內(nèi)容。 、直線(xiàn)電機(jī)的精度達(dá)到多少 直線(xiàn)電機(jī)是種采用電磁原理直接將電能轉(zhuǎn)化成機(jī)械運(yùn)動(dòng)的運(yùn)動(dòng)控制元件,其
    的頭像 發(fā)表于 12-05 16:01 ?1757次閱讀

    AMC1303M2510DWVR X-RAY結(jié)構(gòu)一樣,是否會(huì)影響功能?

    AMC1303M2510DWVRX-RAY結(jié)構(gòu)一樣,是否會(huì)影響功能基板白點(diǎn)是起什么作用的
    發(fā)表于 11-21 07:34

    每次Vivado編譯的結(jié)果都一樣

    很多FPGA工程師都有這種困惑,Vivado每次編譯的結(jié)果都一樣嗎? 在AMD官網(wǎng)上,有這樣個(gè)帖子: Are Vivado results repeatable for identical
    的頭像 發(fā)表于 11-11 11:23 ?1240次閱讀
    每次Vivado編譯的結(jié)果都<b class='flag-5'>一樣</b>嗎

    封裝一樣的磁棒電感通用嗎

    電子發(fā)燒友網(wǎng)站提供《封裝一樣的磁棒電感通用嗎.docx》資料免費(fèi)下載
    發(fā)表于 10-28 11:15 ?0次下載

    使用的TPA3116和3118一樣,工作頻率越高IC的發(fā)熱越大,這樣的情況是否正常?

    我使用的TPA3116和3118一樣,工作頻率越高IC的發(fā)熱越大,這樣的情況是否正常啊。般我理解的 是工作頻率越高,效率就越高,發(fā)熱應(yīng)該越小才對(duì)。特別是在沒(méi)有輸入信號(hào)的時(shí)候,靜態(tài)對(duì)比非常明顯
    發(fā)表于 10-28 07:40

    OPA552和OPA551的輸出電流是一樣的嗎?

    我看手冊(cè)O(shè)PA552和OPA551的輸出電流應(yīng)該是一樣的,但是我用OPA552正向放大VCC=30V,VEE=GND,接上150歐姆的電阻輸出200ma的電流,但是換成OPA551的話(huà),接法都是
    發(fā)表于 08-27 07:42

    OPA361輸入為復(fù)合視頻,輸出視頻圖像畫(huà)面異常,跟過(guò)曝一樣,為什么?

    輸入為復(fù)合視頻,輸出視頻圖像畫(huà)面異常,跟過(guò)曝一樣,不知到是什么原因?
    發(fā)表于 08-19 06:24

    Stem32CubeIDE像Keil一樣指定不同文件下的代碼編譯嗎?

    Stem32CubeIDE像Keil一樣指定不同文件下的代碼編譯
    發(fā)表于 07-23 06:22