方向梯度直方圖(Histogram of Oriented Gradient, HOG)
特征是一種在計(jì)算機(jī)視覺和圖像處理中用來進(jìn)行物體檢測(cè)的特征描述子。HOG特征通過計(jì)算和統(tǒng)計(jì)圖像局部區(qū)域的梯度方向直方圖來構(gòu)成特征。
在一副圖像中,局部目標(biāo)的表象和形狀能夠被梯度或邊緣的方向密度分布很好地描述。其本質(zhì)為:梯度的統(tǒng)計(jì)信息,而梯度主要存在于邊緣的地方
Hog特征結(jié)合SVM分類器已經(jīng)被廣泛應(yīng)用于圖像識(shí)別中,尤其在行人檢測(cè)中獲得了極大的成功。
實(shí)現(xiàn)方法:
2、首先將圖像分成小的連通區(qū)域,這些連通區(qū)域被叫做細(xì)胞單元。然后采集細(xì)胞單元中各像素點(diǎn)的梯度的或邊緣的方向直方圖。最后把這些直方圖組合起來,就可以構(gòu)成特征描述符。
3、性能提高:
將這些局部直方圖在圖像的更大的范圍內(nèi)(叫做區(qū)間)進(jìn)行對(duì)比度歸一化,可以提高該算法的性能,所采用的方法是:先計(jì)算各直方圖在這個(gè)區(qū)間中的密度,然后根據(jù)這個(gè)密度對(duì)區(qū)間中的各個(gè)細(xì)胞單元做歸一化。通過這個(gè)歸一化后,能對(duì)光照變化和陰影獲得更好的效果。
因此HOG特征是特別適合于做圖像中的人體檢測(cè)的 。
1、色彩和伽馬歸一化。
A)、什么是圖像的歸一化
圖像歸一化是指對(duì)圖像進(jìn)行了一系列標(biāo)準(zhǔn)的處理變換,使之變換為一固定標(biāo)準(zhǔn)形式的過程,該標(biāo)準(zhǔn)圖像稱作歸一化圖像。
這樣可以減少光照因素的影響
2、計(jì)算圖像梯度
計(jì)算圖像橫坐標(biāo)和縱坐標(biāo)方向的梯度,計(jì)算每個(gè)像素位置的梯度方向值;
從原始圖像當(dāng)中抽象出來的數(shù)據(jù)圖像數(shù)字符號(hào)等等的這些標(biāo)記稱為圖像特征。
唯一性,完整性,幾何變換不變性,名感性,抽象性
運(yùn)用圖像分割的方法,進(jìn)行處理成為
1) 面積
2) 位置為圖像執(zhí)行的位置,圖像的之心的計(jì)算法方法是
位置為質(zhì)心所在的位置
為轉(zhuǎn)動(dòng)慣量最小的那個(gè)軸,使得所有的點(diǎn)距離該軸的距離的歐氏距離最小。
使用鏈碼表示物體的邊界
鏈碼就是用來表示目標(biāo)物體邊界上的點(diǎn)的數(shù)值序列,可以結(jié)婚時(shí)呢個(gè)存儲(chǔ)信息,而且可以準(zhǔn)確的去頂物體的一些信息。
鏈碼就是用來表示目標(biāo)物體邊界上的點(diǎn)的數(shù)值序列,可以結(jié)婚時(shí)呢個(gè)存儲(chǔ)信息,而且可以準(zhǔn)確的去頂物體的一些信息。
什么是鏈碼表
原鏈碼:
歸一化鏈碼:
原鏈碼具有平移不變性,但是當(dāng)起點(diǎn)不同時(shí)候,會(huì)有不同的鏈碼,所以要使用歸一化鏈碼,確定那個(gè)起始點(diǎn),使得鏈碼的存儲(chǔ)數(shù)據(jù)最小。
差分碼:
由于歸一化鏈碼不具有旋轉(zhuǎn)不變性,于是定義了差分鏈碼。
傅里葉描述子(傅里葉變換的一個(gè)作用就是使得在信息量不發(fā)生變化的情況下將數(shù)據(jù)的表達(dá)形式發(fā)生變化,例如卷積,就是將數(shù)據(jù)從以為變化到二維空間當(dāng)中)。
采用傅里葉描述的一個(gè)優(yōu)點(diǎn)是講二維問題轉(zhuǎn)化為一維問題,
使用傅里葉描述子的方法是:省略后面的n-m個(gè)點(diǎn)。
除此之外還有偏心度。
什么叫做矩:
矩在統(tǒng)計(jì)學(xué)中可以表征隨機(jī)變量的分布,而在力學(xué)中用于表征特征物質(zhì)的分布。
二值圖是一種二維密度的分布函數(shù)。
二維矩不變理論p+q階矩的定義:
P+q階矩的定義
其中,x拔和y拔是圖像的灰度的中心點(diǎn)。
直方圖特征
數(shù)字圖像可以看作是一個(gè)二維隨機(jī)過程的一個(gè)樣本,用聯(lián)合該類分布來描述。
例如:圖像灰度直方圖可以描述圖像的灰度分布情況,(圖像的灰度直方圖就是使用概率分布來表述這些特征在圖像中的分布的情況。)
B表示了灰度級(jí)別,該灰度b在圖像中出現(xiàn)的頻率P(b)m表示了圖像中的總像素?cái)?shù)目。N(b)表示像素為灰度值b的數(shù)目。
P(b)表示了區(qū)域的概率密度函數(shù)。
直方圖給出了灰度圖像額全局描述。在實(shí)際當(dāng)中使用從直方圖中提取出來的一階統(tǒng)計(jì)測(cè)度。來區(qū)別類別間的特征差異
有均值,方差,能量,熵、偏度
偏度:
數(shù)據(jù)集關(guān)于中心點(diǎn)u分布的對(duì)稱情況。
如果大于零,則表示圖像像素偏于中心點(diǎn)的右邊。
在圖像處理領(lǐng)域當(dāng)中,均值u反應(yīng)圖像的平均亮度,方差反應(yīng)圖像灰度級(jí)分布的分散性。但是這兩個(gè)值容易受到圖像采樣情況的影響。 所以應(yīng)該對(duì)他圖像進(jìn)行歸一化處理。。使得所有圖像中的所有圖像都具有相同的均值和方差。 能量是灰度分布對(duì)于原點(diǎn)的二階矩,如果圖像灰度值的等概率分布,則能量最小,熵是圖像中信息量多少的反應(yīng),對(duì)于等概率分布,熵最大。
2、特征直方圖
設(shè) N(xi)為圖像II中某一特征值為xi的像素個(gè)數(shù).M為像素總數(shù)。
圖象的特征直方圖為
特征直方圖就是某一個(gè)特征的該類分布,例如,對(duì)于灰度圖像,直方圖就是灰度的概率分布。
3、什么是梯度方向直方圖
即將梯度的方向正在(-Pi/2,pi/2)中分成k個(gè)均勻的區(qū)域,
或者是梯度幅值的其他形式。但是他們都可以在一定的程度上反應(yīng)像素上一定的邊緣信息。
每一個(gè)像素點(diǎn)附近的梯度特征是一個(gè)k維向量。
圖像的梯度方向直方圖就是圖像中所有像素點(diǎn)的k維團(tuán)體都特征進(jìn)行的直方圖統(tǒng)計(jì)。
3.1、梯度主要存在與邊緣的地方重點(diǎn)內(nèi)容**
使用hog特征對(duì)物體來進(jìn)行特征描述。
1、 圖像的歸一化,傳統(tǒng)的圖像歸一化一般采用gamma標(biāo)準(zhǔn)化形式:
b) 根據(jù)梯度計(jì)算的公式講每個(gè)像素的梯度賦值和方向。
c) 直方圖統(tǒng)計(jì)的放個(gè)單元?jiǎng)澐?。將圖像分成單元和塊。一個(gè)圖像由若干個(gè)放個(gè)單元組成,
d) 計(jì)算一個(gè)塊當(dāng)中的hog特征向量。計(jì)算一個(gè)放個(gè)單元的k個(gè)梯度特征,對(duì)于由n*n個(gè)相鄰方格組成的塊,將每個(gè)方格單元的梯度特征組合在一起,就可以得到這個(gè)塊的特征向量。該特征向量是n*n*k維度。
e) 對(duì)hog特征向量進(jìn)行歸一化,歸一化操作是對(duì)塊進(jìn)行的,主要是為了使得特征向量空間對(duì)光照陰影和變化具有魯棒性。歸一化常用的函數(shù)如下:
6)特征向量的生成
在圖像上以一個(gè)放個(gè)單元為步長(zhǎng)對(duì)塊進(jìn)行華東,將每個(gè)塊的特征組hi在一起,就可以得到圖像的hog特征。
這樣得到的hog特征向量是
3.2 hog特征提取的快速算法
上面給出的是窮舉搜索算法,計(jì)算量偏大,基于積分直方圖的hog的特征提取方法。
使用H(x,y,k) = H(x-1,y,k)+ H(x,y-1,k)+ H(x-1,y-1,k)+Q(x,y)。這個(gè)迭代的式子來計(jì)算(x,y)點(diǎn)出的積分直方圖。
其中q(x,y)為在點(diǎn)(x,y)處的梯度向量計(jì)算公式。
計(jì)算處各個(gè)點(diǎn)處的對(duì)應(yīng)的直方圖之后,圖8-13中區(qū)域v的直方圖Hv計(jì)算公式為:
這樣計(jì)算出來的梯度方向直方圖,可以節(jié)省大量的計(jì)算時(shí)間。
第二篇:csdn上的學(xué)習(xí)資料重點(diǎn)內(nèi)容
Hog方向梯度直方圖和svm支持向量機(jī)的結(jié)合是圖像識(shí)別中的廣泛使用的一種方法。
HOG+SVM進(jìn)行行人檢測(cè)的方法是法國(guó)研究人員Dalal在2005的CVPR上提出的。
先將圖像劃分為許多小的聯(lián)通區(qū)域(細(xì)胞單元),然后采集細(xì)胞單元中各個(gè)像素點(diǎn)的梯度或者邊緣的方向直方圖。最后將這些直方圖組合起來就可以構(gòu)成特征描述器。
此處的計(jì)算梯度方向的方法的原理是使用偏微分,實(shí)際上使用的是使用微分的定義式來進(jìn)行的。這里使用的是一個(gè)以為的離散微分模板,將圖像同時(shí)在水平方向和垂直方向進(jìn)行處理。
注意:微分的計(jì)算公式是dy/dx,在這里沒有除以dx,是因?yàn)閐x就等于1.
把各個(gè)細(xì)胞單元組合成大的、空間上連通的區(qū)間(blocks)。這樣,一個(gè)block內(nèi)所有cell的特征向量串聯(lián)起來便得到該block的HOG特征。這些區(qū)間是互有重疊的,這就意味著:每一個(gè)單元格的特征會(huì)以不同的結(jié)果多次出現(xiàn)在最后的特征向量中。我們將歸一化之后的塊描述符(向量)就稱之為HOG描述符。
行人檢測(cè)的最佳參數(shù)設(shè)置是:3×3細(xì)胞/區(qū)間、6×6像素/細(xì)胞、9個(gè)直方圖通道。則一塊的特征數(shù)為:3*3*9;
Hog的核心的思想是物體的邊緣你的梯度直方圖能夠被邊緣方向的直方圖和光強(qiáng)強(qiáng)度梯度描述。所以就使用邊緣方向來描述物體的邊界,進(jìn)而為區(qū)分物體做好基礎(chǔ)。而直方圖能夠表述整個(gè)圖像的各種特征信息在圖像上的分布情況。
此步就是為圖像的每個(gè)細(xì)胞單元構(gòu)建梯度方向直方圖。細(xì)胞單元中的每一個(gè)像素點(diǎn)都為某個(gè)基于方向的直方圖通道投票。
投票是采取加權(quán)投票(weighted voting)的方式,即每一票都是帶權(quán)值的,這個(gè)權(quán)值是根據(jù)該像素點(diǎn)的梯度幅度計(jì)算出來。
可以采用幅值本身或者它的函數(shù)來表示這個(gè)權(quán)值,實(shí)際測(cè)試表明: 使用幅值來表示權(quán)值能獲得最佳的效果,當(dāng)然,也可以選擇幅值的函數(shù)來表示,比如幅值的平方根、幅值的平方、幅值的截?cái)嘈问降取?/p>
細(xì)胞單元可以是矩形的,也可以是星形的。直方圖通道是平均分布在無向(0~180度)或有向(0~360度)范圍內(nèi)。
作者發(fā)現(xiàn),采用無向的梯度和9個(gè)直方圖通道,能在行人檢測(cè)試驗(yàn)中取得最佳的效果。
把細(xì)胞單元組合成大的區(qū)間。
由于局部光照的變化以及前景-背景對(duì)比度的變化,使得梯度強(qiáng)度的變化范圍非常大。這就需要對(duì)梯度強(qiáng)度做歸一化。
梯度強(qiáng)度歸一化采取的辦法是:把各個(gè)細(xì)胞單元組合成大的、空間上連通的區(qū)間(blocks)。 這樣以來,HOG描述器就變成了由各區(qū)間所有細(xì)胞單元的直方圖成分所組成的一個(gè)向量(就是說,hog描述器就是一個(gè)向量,向量中每一個(gè)元素就是每一個(gè)細(xì)胞單元的直方圖而每一個(gè)細(xì)胞單元的直方圖就是在k個(gè)方向上梯度的投影所組成的向量)。
這些區(qū)間是互有重疊的,這就意味著:每一個(gè)細(xì)胞單元的輸出都多次作用于最終的描述器。區(qū)間有兩個(gè)主要的幾何形狀:矩形區(qū)間(R-HOG)和環(huán)形區(qū)間(C-HOG)。
R-HOG區(qū)間大體上是一些方形的格子,它可以有三個(gè)參數(shù)來表征:每個(gè)區(qū)間中細(xì)胞單元的數(shù)目、每個(gè)細(xì)胞單元中像素點(diǎn)的數(shù)目、每個(gè)細(xì)胞的直方圖通道數(shù)目。作者通過實(shí)驗(yàn)表明,行人檢測(cè)的最佳參數(shù)設(shè)置是:3×3細(xì)胞 /區(qū)間、6×6像素/細(xì)胞、9個(gè)直方圖通道。
作者還發(fā)現(xiàn),在對(duì)直方圖做處理之前,給每個(gè)block加一個(gè)高斯空域窗口(Gaussian spatial window)是非常必要的,因?yàn)檫@樣可以降低邊緣的周圍像素點(diǎn)的權(quán)重。R- HOG跟SIFT描述器看起來很相似,但他們的不同之處是:R-HOG是在單一尺度下、密集的網(wǎng)格內(nèi)、沒有對(duì)方向排序的情況下被計(jì)算出來;而SIFT描述器是在多尺度下、稀疏的圖像關(guān)鍵點(diǎn)上、對(duì)方向排序的情況下被計(jì)算出來。補(bǔ)充一點(diǎn),R-HOG是各區(qū)間被組合起來用于對(duì)空域信息進(jìn)行編碼,而SIFT的各描述器是單獨(dú)使用的。
照這個(gè)直方圖來看的話,就是
對(duì)梯度進(jìn)行歸一化處理: 區(qū)間歸一化(Block normalization Schemes) 引入v表示一個(gè)還沒有被歸一化的向量它包含了給定區(qū)間(block)的所有直方圖信息。| | vk | |表示v的k階范數(shù),這里的k去1、2。用e表示一個(gè)很小的常數(shù)。這時(shí),歸一化因子可以表示如下:
評(píng)論