如何利用CNN實現(xiàn)圖像識別的任務(wù)
輸入層讀入經(jīng)過規(guī)則化(統(tǒng)一大小)的圖像,每一層的每個神經(jīng)元將前一層的一組小的局部近鄰的單元作為輸入,也就是局部感受野和權(quán)值共享,神經(jīng)元抽取一些基本的視覺特征,比如邊緣、角點等,這些特征之后會被更高層的神經(jīng)元所使用。卷積神經(jīng)網(wǎng)絡(luò)通過卷積操作獲得特征圖,每個位置,來自不同特征圖的單元得到各自不同類型的特征。一個卷積層中通常包含多個具有不同權(quán)值向量的特征圖,使得能夠保留圖像更豐富的特征。卷積層后邊會連接池化層進(jìn)行降采樣操作,一方面可以降低圖像的分辨率,減少參數(shù)量,另一方面可以獲得平移和形變的魯棒性。卷積層和池化層的交替分布,使得特征圖的數(shù)目逐步增多,而且分辨率逐漸降低,是一個雙金字塔結(jié)構(gòu)。
CNN的特征
1)具有一些傳統(tǒng)技術(shù)所沒有的優(yōu)點:良好的容錯能力、并行處理能力和自學(xué)習(xí)能力,可處理環(huán)境信息復(fù)雜,背景知識不清楚,推理規(guī)則不明確情況下的問題,允許樣品有較大的缺損、畸變,運行速度快,自適應(yīng)性能好,具有較高的分辨率。它是通過結(jié)構(gòu)重組和減少權(quán)值將特征抽取功能融合進(jìn)多層感知器,省略識別前復(fù)雜的圖像特征抽取過程。
2)泛化能力要顯著優(yōu)于其它方法,卷積神經(jīng)網(wǎng)絡(luò)已被應(yīng)用于模式分類,物體檢測和物體識別等方面。利用卷積神經(jīng)網(wǎng)絡(luò)建立模式分類器,將卷積神經(jīng)網(wǎng)絡(luò)作為通用的模式分類器,直接用于灰度圖像。
3)是一個前潰式神經(jīng)網(wǎng)絡(luò),能從一個二維圖像中提取其拓?fù)浣Y(jié)構(gòu),采用反向傳播算法來優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),求解網(wǎng)絡(luò)中的未知參數(shù)。
4)一類特別設(shè)計用來處理二維數(shù)據(jù)的多層神經(jīng)網(wǎng)絡(luò)。CNN被認(rèn)為是第一個真正成功的采用多層層次結(jié)構(gòu)網(wǎng)絡(luò)的具有魯棒性的深度學(xué)習(xí)方法。CNN通過挖掘數(shù)據(jù)中的空間上的相關(guān)性,來減少網(wǎng)絡(luò)中的可訓(xùn)練參數(shù)的數(shù)量,達(dá)到改進(jìn)前向傳播網(wǎng)絡(luò)的反向傳播算法效率,因為CNN需要非常少的數(shù)據(jù)預(yù)處理工作,所以也被認(rèn)為是一種深度學(xué)習(xí)的方法。在CNN中,圖像中的小塊區(qū)域(也叫做“局部感知區(qū)域”)被當(dāng)做層次結(jié)構(gòu)中的底層的輸入數(shù)據(jù),信息通過前向傳播經(jīng)過網(wǎng)絡(luò)中的各個層,在每一層中都由過濾器構(gòu)成,以便能夠獲得觀測數(shù)據(jù)的一些顯著特征。因為局部感知區(qū)域能夠獲得一些基礎(chǔ)的特征,比如圖像中的邊界和角落等,這種方法能夠提供一定程度對位移、拉伸和旋轉(zhuǎn)的相對不變性。
5)CNN中層次之間的緊密聯(lián)系和空間信息使得其特別適用于圖像的處理和理解,并且能夠自動的從圖像抽取出豐富的相關(guān)特性。
6)CNN通過結(jié)合局部感知區(qū)域、共享權(quán)重、空間或者時間上的降采樣來充分利用數(shù)據(jù)本身包含的局部性等特征,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),并且保證一定程度上的位移和變形的不變性。
7)CNN是一種深度的監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)模型,具有極強(qiáng)的適應(yīng)性,善于挖掘數(shù)據(jù)局部特征,提取全局訓(xùn)練特征和分類,它的權(quán)值共享結(jié)構(gòu)網(wǎng)絡(luò)使之更類似于生物神經(jīng)網(wǎng)絡(luò),在模式識別各個領(lǐng)域都取得了很好的成果。
8) CNN可以用來識別位移、縮放及其它形式扭曲不變性的二維或三維圖像。CNN的特征提取層參數(shù)是通過訓(xùn)練數(shù)據(jù)學(xué)習(xí)得到的,所以其避免了人工特征提取,而是從訓(xùn)練數(shù)據(jù)中進(jìn)行學(xué)習(xí);其次同一特征圖的神經(jīng)元共享權(quán)值,減少了網(wǎng)絡(luò)參數(shù),這也是卷積網(wǎng)絡(luò)相對于全連接網(wǎng)絡(luò)的一大優(yōu)勢。共享局部權(quán)值這一特殊結(jié)構(gòu)更接近于真實的生物神經(jīng)網(wǎng)絡(luò)使CNN在圖像處理、語音識別領(lǐng)域有著獨特的優(yōu)越性,另一方面權(quán)值共享同時降低了網(wǎng)絡(luò)的復(fù)雜性,且多維輸入信號(語音、圖像)可以直接輸入網(wǎng)絡(luò)的特點避免了特征提取和分類過程中數(shù)據(jù)重排的過程。
9)CNN的分類模型與傳統(tǒng)模型的不同點在于其可以直接將一幅二維圖像輸入模型中,接著在輸出端即給出分類結(jié)果。其優(yōu)勢在于不需復(fù)雜的預(yù)處理,將特征抽取,模式分類完全放入一個黑匣子中,通過不斷的優(yōu)化來獲得網(wǎng)絡(luò)所需參數(shù),在輸出層給出所需分類,網(wǎng)絡(luò)核心就是網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計與網(wǎng)絡(luò)的求解。這種求解結(jié)構(gòu)比以往多種算法性能更高。
10)隱層的參數(shù)個數(shù)和隱層的神經(jīng)元個數(shù)無關(guān),只和濾波器的大小和濾波器種類的多少有關(guān)。隱層的神經(jīng)元個數(shù),它和原圖像,也就是輸入的大小(神經(jīng)元個數(shù))、濾波器的大小和濾波器在圖像中的滑動步長都有關(guān)。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103439 -
卷積
+關(guān)注
關(guān)注
0文章
95瀏覽量
18743 -
cnn
+關(guān)注
關(guān)注
3文章
354瀏覽量
22723
發(fā)布評論請先 登錄
AI圖像識別攝像機(jī)

評論