一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

比CNN表現(xiàn)更好,CV領(lǐng)域全新卷積操作OctConv厲害在哪里?

電子工程師 ? 來源:YXQ ? 2019-04-24 11:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

CNN卷積神經(jīng)網(wǎng)絡(luò)問世以來,在計算機視覺領(lǐng)域備受青睞,與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相比,其參數(shù)共享性和平移不變性,使得對于圖像的處理十分友好,然而,近日由Facebook AI、新家坡國立大學、360人工智能研究院的研究人員提出的一種新的卷積操作OctConv使得在圖像處理性能方面得到了重大突破與提升,OctConv和CNN中的卷積有什么不同呢?

論文下載地址:

https://arxiv.org/pdf/1904.05049.pdf

CNN網(wǎng)絡(luò)中的卷積層主要用來提取圖像特征,如下圖所示,利用卷積核(也稱濾波器)對輸入圖像的每個像素進行卷積操作得到特征圖,由于圖像中相鄰像素的特征相似性,卷積核橫掃每個位置,獨立的存儲自己的特征描述符,忽略空間上的一致性,使得特征圖在空間維度上存在大量的冗余。

圖1 普通卷積操作示意圖

OctConv主要基于于處理多空間頻率的特征映射并減少空間冗余的問題提出的。

原文地址:

https://export.arxiv.org/pdf/1904.05049

下面文摘菌將從論文的四個部分展開對OctConv原理的闡述。

Why?—OctConv之誕生

文章摘要(Abstract)部分指出,在自然圖像中,信息以不同的頻率傳輸,其中高頻率通常以細節(jié)進行編碼,而較低頻率通常以總體結(jié)構(gòu)進行編碼,同理卷積層的輸出可以看做不同頻率的信息混合,在論文中,研究者提出通過頻率對特征融合圖進行分解,并設(shè)計出了一種新的Octave卷積(OctConv)操作,旨在存儲和處理在空間上變化緩慢的較低分辨率的特征圖,從而降低內(nèi)存和計算成本。與現(xiàn)存的多尺度方法不同,OctConv是一種單一、通用、即插即用的卷積單元,可以直接代替普通卷積,而無需調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)。

OctConv與那些用于構(gòu)建更優(yōu)拓撲或者減少分組或深度卷積中信道冗余的方法是正交和互補的。

實驗表明,通過使用OctConv替代普通卷積,能很好的提高語音和圖像識別任務(wù)中的精度,同時降低內(nèi)存和計算成本,一個配備有OctConv的ResNet-152能夠以僅僅22.2 GFLOP在ImageNet數(shù)據(jù)集上達到82.5%的top-1分類準確率。

What?—初探OctConv

論文Introduction(介紹)部分基于CNN現(xiàn)存的空間維度冗余問題引出了下圖:

圖2 論文思路闡述圖

(a)動機:研究表明,自然圖像可以分解為低空間頻率和高空間頻率兩部分;

(b)卷積層的輸出圖也可以根據(jù)空間頻率進行分解和分組;

(c)所提出的多頻特征表示將平滑變化的低頻映射存儲字低分辨率張量中,以減少空間冗余;

(d)所提出的OctConv直接作用于這個表示。它會更新每個組的信息,并進一步支持組之間的信息交換。

具體解釋為:如圖 2(a) 所示,自然圖像可以分解為描述平穩(wěn)變化結(jié)構(gòu)的低空間頻率分量和描述快速變化的精細細節(jié)的高空間頻率分量。類似地,我們認為卷積層的輸出特征映射也可以分解為不同空間頻率的特征,并提出了一種新的多頻特征表示方法,將高頻和低頻特征映射存儲到不同的組中,如圖 2(b) 所示。因此,通過相鄰位置間的信息共享,可以安全地降低低頻組的空間分辨率,減少空間冗余,如圖 2(c) 所示。

How?—再探OctConv

論文Method(方法)部分:octave feature 減少了空間冗余,比原始表示更加緊湊。然而,由于輸入特征的空間分辨率不同,傳統(tǒng)卷積不能直接對這種表示進行操作。避免這個問題的一種簡單方法是將低頻部分上采樣到原始的空間分辨率,將它與連接起來,然后進行卷積,這將導致額外的計算和內(nèi)存開銷。為了充分利用緊湊的多頻特征表示,我們提出 Octave Convolution,它可以直接在分解張量X={XH,XL}上運行,而不需要任何額外的計算或內(nèi)存開銷。

Octave Convolution的設(shè)計目標是有效地處理相應(yīng)張量中的低頻和高頻分量,同時使得Octave特征表示的高頻分量和低頻分量之間能夠有效通信。設(shè)X,Y為分解輸入和輸出張量,那么輸出的高頻和低頻信號將由下式給出:

其中H→H,L→L表示自身的更新,L→H,H→L表示高頻與低頻分量之間的通信,如圖3所示綠色箭頭表示信息更新,紅色箭頭表示兩個頻率之間的信息交換。

圖3 Octave Convolution示意圖

同理,我們將卷積核分解為高頻和低頻W={WH,WL},WH=WH→H+WL→H;WL=WL→L+WH→L,如圖4所示:

圖3 Octave Convolution kernel示意圖

對于低頻特征所使用的低頻所占比例a的不同,當a=0時(即沒有低頻成分),OctConv就會退化為普通卷積。經(jīng)過實驗評估k×k Octave 卷積核與普通卷積核等價,即二者具有完全相同的參數(shù)量。

To do—Just do it

論文的實驗部分:研究人員驗證了提出的Octave卷積對于2D和3D網(wǎng)絡(luò)的效能和效率,首先展示了ImageNet圖像分類的控制變量研究,然后將其與當前最優(yōu)的方法進行了比較。之后研究人員使用Kinetics-400和Kinetics-600數(shù)據(jù)集,展示了提出的OctConv也適用于3D CNN。

圖4 ImageNet上的控制變量結(jié)果圖

上表為論文中的表8,視頻中的動作識別、控制變量研究結(jié)果統(tǒng)計。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1709

    瀏覽量

    46779
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    354

    瀏覽量

    22742

原文標題:比CNN表現(xiàn)更好,CV領(lǐng)域全新卷積操作OctConv厲害在哪里?

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    請問在哪里可以找到 DFU HOST TOOL?

    DFU Host Tool 的鏈接似乎已關(guān)閉: 請您告訴我還可以在哪里找到該工具。
    發(fā)表于 05-20 06:51

    自動駕駛感知系統(tǒng)中卷積神經(jīng)網(wǎng)絡(luò)原理的疑點分析

    背景 卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)的核心技術(shù)主要包括以下幾個方面:局部連接、權(quán)值共享、多卷積核以及池化。這些技術(shù)共同作用,使得CNN
    的頭像 發(fā)表于 04-07 09:15 ?362次閱讀
    自動駕駛感知系統(tǒng)中<b class='flag-5'>卷積</b>神經(jīng)網(wǎng)絡(luò)原理的疑點分析

    STMHAL庫的USB每次插拔時識別位置在哪里

    STMHAL庫的USB每次插拔時識別位置在哪里?
    發(fā)表于 03-07 14:00

    如何使用MATLAB實現(xiàn)一維時間卷積網(wǎng)絡(luò)

    本文對一維卷積操作進行介紹,包括一維擴展卷積和一維因果卷積,以及 MATLAB 對一維卷積的支持情況。在最后通過一個實例演示如何在 MATL
    的頭像 發(fā)表于 03-07 09:15 ?1082次閱讀
    如何使用MATLAB實現(xiàn)一維時間<b class='flag-5'>卷積</b>網(wǎng)絡(luò)

    人工智能的下一站在哪里

    DeepSeek的爆發(fā)進一步推動了AI行業(yè)的發(fā)展速度,這讓人們不得不想象AI的下一站在哪里?維智科技所深耕的時空大模型與AI發(fā)展的邏輯軌跡又是如何聯(lián)系的?
    的頭像 發(fā)表于 02-14 10:27 ?445次閱讀

    BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的比較

    多層。 每一層都由若干個神經(jīng)元構(gòu)成,神經(jīng)元之間通過權(quán)重連接。信號在神經(jīng)網(wǎng)絡(luò)中是前向傳播的,而誤差是反向傳播的。 卷積神經(jīng)網(wǎng)絡(luò)(CNN) : CNN主要由卷積層、池化層和全連接層組成。
    的頭像 發(fā)表于 02-12 15:53 ?668次閱讀

    AI模型部署邊緣設(shè)備的奇妙之旅:目標檢測模型

    通道數(shù)時表現(xiàn)更好。 2.3 神經(jīng)網(wǎng)絡(luò)的相關(guān)知識點 2.3.1 卷積的基本概念 卷積是一種數(shù)學運算,在計算機視覺中被廣泛應(yīng)用于特征提取。它通過一個小型矩陣(稱為
    發(fā)表于 12-19 14:33

    卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)調(diào)整方法

    卷積神經(jīng)網(wǎng)絡(luò)因其在處理具有空間層次結(jié)構(gòu)的數(shù)據(jù)時的卓越性能而受到青睞。然而,CNN的成功很大程度上依賴于其參數(shù)的合理設(shè)置。參數(shù)調(diào)整是一個復(fù)雜的過程,涉及到多個超參數(shù)的選擇和優(yōu)化。 網(wǎng)絡(luò)架構(gòu)參數(shù) 卷積
    的頭像 發(fā)表于 11-15 15:10 ?1208次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本原理與算法

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一類包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Networks,F(xiàn)NN
    的頭像 發(fā)表于 11-15 14:47 ?1782次閱讀

    智慧燈桿到底“智慧”在哪里?條形智能為您專業(yè)解讀 AI燈桿屏

    智慧燈桿到底“智慧”在哪里?條形智能為您專業(yè)解讀 AI燈桿屏
    的頭像 發(fā)表于 11-14 13:51 ?642次閱讀
    智慧燈桿到底“智慧”<b class='flag-5'>在哪里</b>?條形智能為您專業(yè)解讀 AI燈桿屏

    關(guān)于卷積神經(jīng)網(wǎng)絡(luò),這些概念你厘清了么~

    許多種類型,但本文將只關(guān)注卷積神經(jīng)網(wǎng)絡(luò)(CNN),其主要應(yīng)用領(lǐng)域是對輸入數(shù)據(jù)的模式識別和對象分類。CNN是一種用于深度學習的 人工神經(jīng)網(wǎng)絡(luò) 。這種網(wǎng)絡(luò)由輸入層、若干
    發(fā)表于 10-24 13:56

    高斯濾波的卷積核怎么確定

    N為一個奇數(shù),如3、5、7等。奇數(shù)大小的卷積核有助于確定一個中心像素點,便于計算。 大小選擇 :卷積核的大小決定了濾波器的范圍。較大的卷積核可以覆蓋更多的像素點,從而更好地平滑圖像,但
    的頭像 發(fā)表于 09-29 09:29 ?1685次閱讀

    貼片電容與貼片電阻的本質(zhì)差異在哪里?

    貼片電容與貼片電阻的本質(zhì)差異在哪里?
    的頭像 發(fā)表于 08-27 15:51 ?792次閱讀
    貼片電容與貼片電阻的本質(zhì)差異<b class='flag-5'>在哪里</b>?

    服務(wù)器可以用在哪領(lǐng)域

    服務(wù)器可以用在哪領(lǐng)域呢?
    的頭像 發(fā)表于 08-26 11:09 ?951次閱讀

    凱茉銳電子SONY FCB-CV7520機芯在無人機航拍方面的應(yīng)用表現(xiàn)

    的性能參數(shù),在多個維度上重新定義了航拍體驗,為安防監(jiān)控、智能交通、乃至無人駕駛飛行設(shè)備等領(lǐng)域帶來了革命性的變化。以下是對FCB-CV7520在無人機航拍方面應(yīng)用表現(xiàn)的深入探討。
    的頭像 發(fā)表于 08-08 10:25 ?594次閱讀