導(dǎo)讀
在本文中,我們將討論目標(biāo)檢測(cè)模型和Objectness的基礎(chǔ)知識(shí)。
什么是物體檢測(cè)模型?
物體檢測(cè)模型本質(zhì)上,正如其名稱所示,檢測(cè)物體。這意味著給定一個(gè)圖像,它可以告訴你物體在哪里,以及這個(gè)物體是什么。例如,在上面的圖像中,我們有許多物體,并且使用物體檢測(cè)模型,我們已經(jīng)檢測(cè)出不同的物體在圖像中的位置。
這類模型有很多應(yīng)用。舉幾個(gè)例子,物體檢測(cè)在以下方面很有用:
自動(dòng)駕駛汽車,可以檢測(cè)到乘客、其他車輛、紅綠燈和停車標(biāo)志。
安保,模型可以探測(cè)到公共區(qū)域的槍支或炸彈,并向附近的警察報(bào)警。
總的來(lái)說(shuō),這類模型非常有用,在過(guò)去幾年里,機(jī)器學(xué)習(xí)社區(qū)已經(jīng)對(duì)它們進(jìn)行了大量的研究。
物體檢測(cè)中區(qū)域建議的介紹
首先,讓我們了解一下物體檢測(cè)模型是如何工作的。首先,我們必須給出一個(gè)物體的建議位置。我們把這個(gè)建議的位置稱為我們感興趣的區(qū)域,通常顯示在一個(gè)邊界框(也稱為圖像窗口)中。根據(jù)物體檢測(cè)模型的類型,我們可以通過(guò)許多不同的方式來(lái)實(shí)現(xiàn)這一點(diǎn)。
樸素方法:我們將圖像分割成多個(gè)部分,并對(duì)每個(gè)部分進(jìn)行分類。這種方法效率低下是因?yàn)楸仨殞?duì)每個(gè)生成的窗口應(yīng)用分類網(wǎng)絡(luò)(CNN),導(dǎo)致計(jì)算時(shí)間長(zhǎng)。
滑動(dòng)窗口方法:我們預(yù)先確定好窗口比例(或“錨”),然后滑過(guò)圖像。對(duì)于每個(gè)窗口,我們處理它并繼續(xù)滑動(dòng)。與樸素方法類似,這種方法生成的窗口較多,處理時(shí)間也比較長(zhǎng)。
選擇性搜索:使用顏色相似度,紋理相似度,和一些其他的圖像細(xì)節(jié),我們可以用算法將圖像分割成區(qū)域。雖然選擇性搜索算法本身是耗時(shí)的,但這使得分類網(wǎng)絡(luò)的應(yīng)用需求較少。
區(qū)域建議網(wǎng)絡(luò):我們創(chuàng)建一個(gè)單獨(dú)的網(wǎng)絡(luò)來(lái)確定圖像中感興趣的區(qū)域。這使得我們的模型工作得更快,但也使得我們最終模型的準(zhǔn)確性依賴于多個(gè)網(wǎng)絡(luò)。
上面列出的這些不同選項(xiàng)之間有一些區(qū)別,但一般來(lái)說(shuō),當(dāng)我們加快網(wǎng)絡(luò)的處理時(shí)間時(shí),我們往往會(huì)犧牲模型的準(zhǔn)確性。
區(qū)域建議機(jī)制的主要問(wèn)題是,如果建議的區(qū)域不包含物體,那么你的分類網(wǎng)絡(luò)也會(huì)去分類這個(gè)區(qū)域,并給出一個(gè)錯(cuò)誤的標(biāo)記。
那么,什么是Objectness?
Objectness本質(zhì)上是物體存在于感興趣區(qū)域內(nèi)的概率的度量。如果我們Objectness很高,這意味著圖像窗口可能包含一個(gè)物體。這允許我們快速地刪除不包含任何物體的圖像窗口。
如果一幅圖像具有較高的Objectness,我們期望它具有:
在整個(gè)圖像中具有唯一性
物體周圍有嚴(yán)格的邊界
與周圍環(huán)境的外觀不同
例如,在上面的圖像中,我們期望紅色框具有較低的Objectness,藍(lán)色框具有中等的Objectness,綠色框具有較高的Objectness。這是因?yàn)榫G色的框“緊密”地圍繞著我們的物體,而藍(lán)色的框則很松散,而紅色的框根本不包含任何物體。
我們?nèi)绾味攘縊bjectness?
有大量的參數(shù)影響圖像窗口的objectness。
多尺度顯著性:這本質(zhì)上是對(duì)圖像窗口的外觀獨(dú)特性的度量。與整個(gè)圖像相比,框中唯一性像素的密度越高,該值就越高。
顏色對(duì)比度:框內(nèi)像素與建議圖像窗口周圍區(qū)域的顏色對(duì)比度越大,該值越大。
邊緣密度:我們定義邊緣為物體的邊界,這個(gè)值是圖像窗口邊界附近的邊緣的度量值。一個(gè)有趣的算法可以找到這些邊緣:https://cv-tricks.com/opencv-dnn/edge-detection-hed/。
超像素跨越:我們定義超像素是幾乎相同顏色的像素團(tuán)。如果該值很高,則框內(nèi)的所有超像素只包含在其邊界內(nèi)。
超像素區(qū)域以不同顏色顯示。請(qǐng)注意,框內(nèi)的超像素大部分不會(huì)泄漏到圖像窗口之外。因此,這個(gè)“超素跨界”值將會(huì)很高。
以上參數(shù)值越高,objectness越高。試著將上述參數(shù)與我們前面列出的具有高objectness的圖像的期望聯(lián)系起來(lái)。
責(zé)任編輯:lq
-
圖像分割
+關(guān)注
關(guān)注
4文章
182瀏覽量
18339 -
檢測(cè)模型
+關(guān)注
關(guān)注
0文章
17瀏覽量
7374 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8501瀏覽量
134565
原文標(biāo)題:理解物體檢測(cè)中的Objectness
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
基于LockAI視覺(jué)識(shí)別模塊:C++目標(biāo)檢測(cè)
功率器件熱設(shè)計(jì)基礎(chǔ)知識(shí)
PCB繪制基礎(chǔ)知識(shí)

AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測(cè)模型
華為-射頻基礎(chǔ)知識(shí)培訓(xùn)
TWL6030氣體監(jiān)測(cè)基礎(chǔ)知識(shí)

Verilog HDL的基礎(chǔ)知識(shí)

負(fù)載開(kāi)關(guān)基礎(chǔ)知識(shí)

全新的半導(dǎo)體基礎(chǔ)知識(shí)

超聲波傳感基礎(chǔ)知識(shí)

評(píng)論