一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度學習中的圖像分割

新機器視覺 ? 來源:新機器視覺 ? 2023-05-05 11:35 ? 次閱讀

深度學習中的圖像分割

深度學習可以學習視覺輸入的模式,以預測組成圖像的對象類。用于圖像處理的主要深度學習架構是卷積神經網絡(CNN),或者是特定的CNN框架,如AlexNet、VGG、Inception和ResNet。計算機視覺的深度學習模型通常在專門的圖形處理單元(GPU)上訓練和執(zhí)行,以減少計算時間。

圖像分割

圖像分割是計算機視覺中的一個關鍵過程。它包括將視覺輸入分割成片段以簡化圖像分析。片段表示目標或目標的一部分,并由像素集或“超像素”組成。圖像分割將像素組織成更大的部分,消除了將單個像素作為觀察單位的需要。

圖像分析有三個層次

分類:將整幅圖片分成若干類別

目標檢測:檢測圖像中的目標并在其周圍畫一個矩形

分割:識別圖像的部分,并理解它們屬于什么對象。分割是進行目標檢測和分類的基礎

語義分割 實例分割

在分割時,依據(jù)分割結果,有兩個粒度級別

語義分割:將圖像中的所有像素劃分為有意義的對象類。這些類是“語義上可解釋的”,并對應于現(xiàn)實世界的類別。例如,你可以將與貓相關的所有像素分離出來,并將它們涂成綠色。這也被稱為dense預測,因為它預測了每個像素的含義。

實例分割- 標識圖像中每個對象的每個實例。它與語義分割的不同之處在于它不是對每個像素進行分類。

傳統(tǒng)的圖像分割方法

還有一些過去常用的圖像分割技術,但效率不如深度學習技術,因為它們使用嚴格的算法,需要人工干預和專業(yè)知識。這些包括

閾值:將圖像分割為前景和背景。指定的閾值將像素分為兩個級別之一,以隔離對象。閾值化將灰度圖像轉換為二值圖像或將彩色圖像的較亮和較暗像素進行區(qū)分。

K-means聚類:算法識別數(shù)據(jù)中的組,變量K表示組的數(shù)量。該算法根據(jù)特征相似性將每個數(shù)據(jù)點(或像素)分配到其中一組。聚類不是分析預定義的組,而是迭代地工作,從而有機地形成組。

基于直方圖的圖像分割:使用直方圖根據(jù)“灰度”對像素進行分組。簡單的圖像由一個對象和一個背景組成。背景通常是一個灰度級,是較大的實體。因此,一個較大的峰值代表了直方圖中的背景灰度。一個較小的峰值代表這個物體,這是另一個灰色級別。

邊緣檢測:識別亮度的急劇變化或不連續(xù)的地方。邊緣檢測通常包括將不連續(xù)點排列成曲線線段或邊緣。例如,一塊紅色和一塊藍色之間的邊界。

深度學習如何助力圖像分割方法

現(xiàn)代圖像分割技術以深度學習技術為動力。

下面是幾種用于分割的深度學習架構

使用CNN進行圖像分割,是將圖像的patch作為輸入輸入給卷積神經網絡,卷積神經網絡對像素進行標記。CNN不能一次處理整個圖像。它掃描圖像,每次看一個由幾個像素組成的小“濾鏡”,直到它映射出整個圖像。

傳統(tǒng)的cnn網絡具有全連接的層,不能處理不同的輸入大小。FCNs使用卷積層來處理不同大小的輸入,可以工作得更快。最終的輸出層具有較大的感受野,對應于圖像的高度和寬度,而通道的數(shù)量對應于類的數(shù)量。卷積層對每個像素進行分類,以確定圖像的上下文,包括目標的位置。

集成學習:將兩個或兩個以上相關分析模型的結果合成為單個。集成學習可以提高預測精度,減少泛化誤差。這樣就可以對圖像進行精確的分類和分割。通過集成學習嘗試生成一組弱的基礎學習器,對圖像的部分進行分類,并組合它們的輸出,而不是試圖創(chuàng)建一個單一的最優(yōu)學習者。

DeepLab:使用DeepLab的一個主要動機是在幫助控制信號抽取的同時執(zhí)行圖像分割 —— 減少樣本的數(shù)量和網絡必須處理的數(shù)據(jù)量。另一個動機是啟用多尺度上下文特征學習 —— 從不同尺度的圖像中聚合特征。DeepLab使用ImageNet預訓練的ResNet進行特征提取。DeepLab使用空洞卷積而不是規(guī)則的卷積。每個卷積的不同擴張率使ResNet塊能夠捕獲多尺度的上下文信息。

DeepLab由三個部分組成

Atrous convolutions— 使用一個因子,可以擴展或收縮卷積濾波器的視場。

ResNet— 微軟的深度卷積網絡(DCNN)。它提供了一個框架,可以在保持性能的同時訓練數(shù)千個層。ResNet強大的表征能力促進了計算機視覺應用的發(fā)展,如物體檢測和人臉識別。

Atrous spatial pyramid pooling (ASPP)— 提供多尺度信息。它使用一組具有不同擴展率的復雜函數(shù)來捕獲大范圍的上下文。ASPP還使用全局平均池(GAP)來合并圖像級特征并添加全局上下文信息。

SegNet neural network:一種基于深度編碼器和解碼器的架構,也稱為語義像素分割。它包括對輸入圖像進行低維編碼,然后在解碼器中利用方向不變性能力恢復圖像。然后在解碼器端生成一個分割圖像。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4797

    瀏覽量

    102321
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4882

    瀏覽量

    130390
  • 計算機
    +關注

    關注

    19

    文章

    7607

    瀏覽量

    89823
  • 圖像分割
    +關注

    關注

    4

    文章

    182

    瀏覽量

    18196
  • 深度學習
    +關注

    關注

    73

    文章

    5547

    瀏覽量

    122306

原文標題:深度學習中的圖像分割

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    主動脈夾層分割深度學習模型是如何煉成的?

    利用深度學習進行主動脈真假腔分割有賴于大量手動標注的主動脈圖像來訓練深度學習網絡,計算量大,且對
    的頭像 發(fā)表于 07-17 09:14 ?6227次閱讀

    深度學習在醫(yī)學圖像分割與病變識別的應用實戰(zhàn)

    等方面具有重要意義。本文將介紹這一領域的背景、挑戰(zhàn),以及通過一個代碼實例展示如何利用深度學習方法進行醫(yī)學圖像分割與病變識別。 背景與挑戰(zhàn)醫(yī)學圖像
    發(fā)表于 09-04 11:11

    圖像分割圖像邊緣檢測

     圖像分割的研究多年來一直受到人們的高度重視,至今提出了各種類型的分割算法。Pal把圖像分割算法分成了6類:閾值
    發(fā)表于 12-19 09:29 ?1.1w次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>分割</b>和<b class='flag-5'>圖像</b>邊緣檢測

    深度學習圖像分割的方法和應用

    介紹使圖像分割的方法,包括傳統(tǒng)方法和深度學習方法,以及應用場景。 基于人工智能和深度學習方法的現(xiàn)
    的頭像 發(fā)表于 11-27 10:29 ?3400次閱讀

    詳解深度學習圖像分割

    基于人工智能和深度學習方法的現(xiàn)代計算機視覺技術在過去10年里取得了顯著進展。如今,它被用于圖像分類、人臉識別、圖像物體的識別、視頻分析和分
    的頭像 發(fā)表于 01-06 15:50 ?3844次閱讀

    圖像分割的方法,包括傳統(tǒng)方法和深度學習方法

    許多計算機視覺任務需要對圖像進行智能分割,以理解圖像的內容,并使每個部分的分析更加容易。今天的圖像分割
    的頭像 發(fā)表于 01-08 14:44 ?9491次閱讀

    分析總結基于深度神經網絡的圖像語義分割方法

    隨著深度學習技術的快速發(fā)展及其在語義分割領域的廣泛應用,語義分割效果得到顯著提升。對基于深度神經網絡的
    發(fā)表于 03-19 14:14 ?21次下載
    分析總結基于<b class='flag-5'>深度</b>神經網絡的<b class='flag-5'>圖像</b>語義<b class='flag-5'>分割</b>方法

    深度學習在視頻對象分割的應用及相關研究

    視頻對象分割是指在給定的一段視頻序列的各幀圖像,找岀屬于特定前景對象的所有像素點位置區(qū)域。隨著硬件平臺計算能力的提升,深度學習受到了越來越
    發(fā)表于 03-24 15:47 ?9次下載
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>在視頻對象<b class='flag-5'>分割</b><b class='flag-5'>中</b>的應用及相關研究

    基于深度神經網絡的圖像語義分割方法

    圖像語義分割是計算機視覺領堿近年來的熱點硏究課題,隨著深度學習技術的興起,圖像語義分割
    發(fā)表于 04-02 13:59 ?11次下載
    基于<b class='flag-5'>深度</b>神經網絡的<b class='flag-5'>圖像</b>語義<b class='flag-5'>分割</b>方法

    淺談關于深度學習方法的圖像分割

    許多計算機視覺任務需要對圖像進行智能分割,以理解圖像的內容,并使每個部分的分析更加容易。今天的圖像分割
    的頭像 發(fā)表于 07-06 10:50 ?2313次閱讀

    基于深度學習的場景分割算法研究

    場景分割的目標是判斷場景圖像每個像素的類別.場景分割是計算機視覺領域重要的基本問題之一,對場景圖像的分析和理解具有重要意義,同時在自動駕駛
    發(fā)表于 02-12 11:28 ?665次閱讀

    基于深度學習的點云分割的方法介紹

      摘 要:點云分割是點云數(shù)據(jù)理解的一個關鍵技術,但傳統(tǒng)算法無法進行實時語義分割。近年來深度學習被應用在點云
    發(fā)表于 07-20 15:23 ?3次下載

    深度學習圖像語義分割指標介紹

    深度學習圖像語義分割上已經取得了重大進展與明顯的效果,產生了很多專注于圖像語義分割的模型與基準
    發(fā)表于 10-09 15:26 ?565次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>圖像</b>語義<b class='flag-5'>分割</b>指標介紹

    機器人視覺技術圖像分割方法有哪些

    和分析。本文將詳細介紹圖像分割的各種方法,包括傳統(tǒng)的圖像處理方法和基于深度學習的方法。 閾值分割
    的頭像 發(fā)表于 07-04 11:34 ?1444次閱讀

    圖像分割與語義分割的CNN模型綜述

    圖像分割與語義分割是計算機視覺領域的重要任務,旨在將圖像劃分為多個具有特定語義含義的區(qū)域或對象。卷積神經網絡(CNN)作為深度
    的頭像 發(fā)表于 07-09 11:51 ?1566次閱讀