3.2.4語義分割
圖3-7所示為機器視覺語義分割示例。
計算機視覺的核心是分割,它將整個圖像分成一個個像素組,然后對其進行標記和分類。語義分割試圖在語義上理解圖像中每個像素的角色(例如,識別它是道路、汽車還是其他類別)。如圖3-7所示,除識別人、道路、汽車、樹木等外,還必須確定每個物體的邊界。因此,與分類不同,需要用模型對密集的像素進行預測。
與其他計算機視覺任務一樣,卷積神經網絡在分割任務上取得了巨大成功。最流行的原始方法之一是通過滑動窗口進行塊分類,利用每個像素周圍的圖像塊,對每個像素
分別進行分類。但是其計算效率非常低,因為我們不能在重疊塊之間重用共享特征。解決方案之一就是加州大學伯克利分校提出的全卷積網絡(FCN),它提出了端到端的卷積神經網絡體系結構,在沒有任何全連接層的情況下進行密集預測,如圖3-8所示。
圖3-8 全卷積網絡(FCN)實現像素分類演示
這種方法允許針對任何尺寸的圖像生成分割映射,并且比塊分類算法快得多,幾乎后續(xù)所有的語義分割算法都采用了這種范式。
-
智慧燈桿
+關注
關注
1文章
828瀏覽量
12004
發(fā)布評論請先 登錄
評論