SSD算法是在YOLO的基礎(chǔ)上改進的單階段方法,他給予一個前向傳播的神經(jīng)網(wǎng)絡,最主要的優(yōu)點是能在兼顧速度的同時確保高精度,而且由于采用了END-TO-END的訓練方法,及時處理的分辨率比較低的照片,分類結(jié)果也很準確。
SSD 網(wǎng)絡結(jié)構(gòu)分為4個部分:基礎(chǔ)網(wǎng)絡+附加特征層+預測 +非極大值抑制

其中,基礎(chǔ)網(wǎng)絡是VGG-16的前4層網(wǎng)絡,主要選取其中的Conv4_3 作為第一個特征層用于目標檢測,并將VGG16中的FC7改成了卷積層Conv7。
附加特征層是在 VGG-16基礎(chǔ)網(wǎng)絡上添加的特征圖逐漸變小的特征提取層,分別為Conv8_2、Conv9_2、Conv10 2、Conv11 2層。它們和VGG中的Conv4 3、Conv7共同組成了6層的金字塔網(wǎng)絡。金字塔網(wǎng)絡是 SSD的設計核心,能通過不同尺度的特征圖來預測目標分類與位置,進而提高檢測精度。對于每一層特征圖,SSD 網(wǎng)絡會對每個像素點預測多個邊界框,(假設每個像素點預測4個邊界框),然后使用不同尺寸邊界框的特征進行預測,這樣模擬了類似人眼從遠到近觀察事物的特點,較大尺寸的特征圖適合于對較大物體的預測,而較小尺寸的特征圖適合于對較小物體的預測。

預測層(detection layer)需要對邊界框中目標的類別進行預測,同時還需要對邊界框的實際位置進行預測。預測層分成 cls 分支和 1oc 分支,每個分支中包含6個(因為有6個特征層)卷積層 conv,conv 的輸出尺寸和輸人尺寸相同。cls 分支預測每個邊界框所有分類的得分;loc 分支預測4個對于邊界框的位置偏移量。以SSD300 網(wǎng)絡為例,最終可以得到8732個邊界框的預測結(jié)果。
非極大值抑制(Non-Maximum Suppression,NMS)將根據(jù)設置的置信度闕值對預測層輸出的預測結(jié)果進行排序和篩選,刪除不符合要求的邊界框,保留與真實結(jié)果匹配度較高的預測結(jié)果。
上面四層完成了 SSD 網(wǎng)絡的整個檢測流程。在訓練過程中SSD 網(wǎng)絡使用多框損失函數(shù)(MultiBoxLoss)優(yōu)化網(wǎng)絡。多框損失函數(shù)包括類別損失和位置損失兩個部分。
下式中、入是通過NMS 匹配到真實結(jié)果的邊界框數(shù)量;Leonr(x,c)為類別損失,是典型的softmax損失;L(,g)為位置損失,是采用Smooth L1的回歸損失;a參數(shù)用于調(diào)整類別損失和位置損失之間的比例,默認 a=1。
L(x,c,l,g)=一(Lonr(x,c)+aLoc(x,l,g))
此外,SSD網(wǎng)絡的訓練過程中還使用了數(shù)據(jù)加強、匹配策略(matching strategy)、難分樣本挖掘(hardnegative mining)等技術(shù)提高準確率。最終SSD網(wǎng)絡在性能上取得了展示了SSD網(wǎng)絡在PASCALVOC2012數(shù)據(jù)集上同其他模型的對比數(shù)據(jù)。

-
SSD
+關(guān)注
關(guān)注
21文章
2980瀏覽量
119517 -
AI
+關(guān)注
關(guān)注
88文章
35041瀏覽量
279115 -
人工智能
+關(guān)注
關(guān)注
1806文章
48987瀏覽量
249076 -
目標檢測
+關(guān)注
關(guān)注
0文章
224瀏覽量
16003
發(fā)布評論請先 登錄
人工智能就業(yè)前景
人工智能技術(shù)及算法設計指南
安防業(yè)再現(xiàn)人工智能風波之真假AI人形檢測
PowerPC小目標檢測算法怎么實現(xiàn)?
基于YOLOX目標檢測算法的改進
基于SSD網(wǎng)絡模型的多目標檢測算法
一種改進的單激發(fā)探測器小目標檢測算法
基于多尺度融合SSD的小目標檢測算法綜述
基于Grad-CAM與KL損失的SSD目標檢測算法
快速入門自動駕駛中目標檢測算法

評論