一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

圖像分割的方法,包括傳統(tǒng)方法和深度學習方法

Dbwd_Imgtec ? 來源:AI公園 ? 作者:AI公園 ? 2021-01-08 14:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導讀

介紹使圖像分割的方法,包括傳統(tǒng)方法和深度學習方法,以及應用場景。

基于人工智能和深度學習方法的現(xiàn)代計算機視覺技術在過去10年里取得了顯著進展。如今,它被用于圖像分類、人臉識別、圖像中物體的識別、視頻分析和分類以及機器人自動駕駛車輛的圖像處理等應用上。

許多計算機視覺任務需要對圖像進行智能分割,以理解圖像中的內容,并使每個部分的分析更加容易。今天的圖像分割技術使用計算機視覺深度學習模型來理解圖像的每個像素所代表的真實物體,這在十年前是無法想象的。

深度學習可以學習視覺輸入的模式,以預測組成圖像的對象類。用于圖像處理的主要深度學習架構是卷積神經網絡(CNN),或者是特定的CNN框架,如AlexNet、VGG、Inception和ResNet。計算機視覺的深度學習模型通常在專門的圖形處理單元(GPU)上訓練和執(zhí)行,以減少計算時間。

什么是圖像分割?

圖像分割是計算機視覺中的一個關鍵過程。它包括將視覺輸入分割成片段以簡化圖像分析。片段表示目標或目標的一部分,并由像素集或“超像素”組成。圖像分割將像素組織成更大的部分,消除了將單個像素作為觀察單位的需要。圖像分析有三個層次:

分類

將整幅圖片分成“人”、“動物”、“戶外”等類別

目標檢測 檢測圖像中的目標并在其周圍畫一個矩形,例如一個人或一只羊。

分割 識別圖像的部分,并理解它們屬于什么對象。分割是進行目標檢測和分類的基礎。

語義分割 vs. 實例分割

在分割過程本身,有兩個粒度級別:

語義分割將圖像中的所有像素劃分為有意義的對象類。這些類是“語義上可解釋的”,并對應于現(xiàn)實世界的類別。例如,你可以將與貓相關的所有像素分離出來,并將它們涂成綠色。這也被稱為dense預測,因為它預測了每個像素的含義。

實例分割

標識圖像中每個對象的每個實例。它與語義分割的不同之處在于它不是對每個像素進行分類。如果一幅圖像中有三輛車,語義分割將所有的車分類為一個實例,而實例分割則識別每一輛車。

傳統(tǒng)的圖像分割方法

還有一些過去常用的圖像分割技術,但效率不如深度學習技術,因為它們使用嚴格的算法,需要人工干預和專業(yè)知識。這些包括:

閾值

將圖像分割為前景和背景。指定的閾值將像素分為兩個級別之一,以隔離對象。閾值化將灰度圖像轉換為二值圖像或將彩色圖像的較亮和較暗像素進行區(qū)分。

K-means聚類

算法識別數(shù)據(jù)中的組,變量K表示組的數(shù)量。該算法根據(jù)特征相似性將每個數(shù)據(jù)點(或像素)分配到其中一組。聚類不是分析預定義的組,而是迭代地工作,從而有機地形成組。

基于直方圖的圖像分割

使用直方圖根據(jù)“灰度”對像素進行分組。簡單的圖像由一個對象和一個背景組成。背景通常是一個灰度級,是較大的實體。因此,一個較大的峰值代表了直方圖中的背景灰度。一個較小的峰值代表這個物體,這是另一個灰色級別。

邊緣檢測識別亮度的急劇變化或不連續(xù)的地方。邊緣檢測通常包括將不連續(xù)點排列成曲線線段或邊緣。例如,一塊紅色和一塊藍色之間的邊界。

深度學習如何助力圖像分割方法

現(xiàn)代圖像分割技術以深度學習技術為動力。

下面是幾種用于分割的深度學習架構:

使用CNN進行圖像分割,是將圖像的patch作為輸入輸入給卷積神經網絡,卷積神經網絡對像素進行標記。CNN不能一次處理整個圖像。它掃描圖像,每次看一個由幾個像素組成的小“濾鏡”,直到它映射出整個圖像。

傳統(tǒng)的cnn網絡具有全連接的層,不能處理不同的輸入大小。FCNs使用卷積層來處理不同大小的輸入,可以工作得更快。最終的輸出層具有較大的感受野,對應于圖像的高度和寬度,而通道的數(shù)量對應于類的數(shù)量。卷積層對每個像素進行分類,以確定圖像的上下文,包括目標的位置。

集成學習將兩個或兩個以上相關分析模型的結果合成為單個。集成學習可以提高預測精度,減少泛化誤差。這樣就可以對圖像進行精確的分類和分割。通過集成學習嘗試生成一組弱的基礎學習器,對圖像的部分進行分類,并組合它們的輸出,而不是試圖創(chuàng)建一個單一的最優(yōu)學習者。

DeepLab使用DeepLab的一個主要動機是在幫助控制信號抽取的同時執(zhí)行圖像分割 —— 減少樣本的數(shù)量和網絡必須處理的數(shù)據(jù)量。另一個動機是啟用多尺度上下文特征學習 —— 從不同尺度的圖像中聚合特征。DeepLab使用ImageNet預訓練的ResNet進行特征提取。DeepLab使用空洞卷積而不是規(guī)則的卷積。每個卷積的不同擴張率使ResNet塊能夠捕獲多尺度的上下文信息。

DeepLab由三個部分組成:

Atrous convolutions

使用一個因子,可以擴展或收縮卷積濾波器的視場。

ResNet微軟的深度卷積網絡(DCNN)。它提供了一個框架,可以在保持性能的同時訓練數(shù)千個層。ResNet強大的表征能力促進了計算機視覺應用的發(fā)展,如物體檢測和人臉識別。

Atrous spatial pyramid pooling (ASPP)提供多尺度信息。它使用一組具有不同擴展率的復雜函數(shù)來捕獲大范圍的上下文。ASPP還使用全局平均池(GAP)來合并圖像級特征并添加全局上下文信息。

SegNet neural network 一種基于深度編碼器和解碼器的架構,也稱為語義像素分割。它包括對輸入圖像進行低維編碼,然后在解碼器中利用方向不變性能力恢復圖像。然后在解碼器端生成一個分割圖像。

d2d8bfda-44a1-11eb-8b86-12bb97331649.png

圖像分割的應用

圖像分割有助于確定目標之間的關系,以及目標在圖像中的上下文。應用包括人臉識別、車牌識別和衛(wèi)星圖像分析。例如,零售和時尚等行業(yè)在基于圖像的搜索中使用了圖像分割。自動駕駛汽車用它來了解周圍的環(huán)境。

目標檢測和人臉檢測

這些應用包括識別數(shù)字圖像中特定類的目標實例。語義對象可以分類成類,如人臉、汽車、建筑物或貓。

人臉檢測

一種用于許多應用的目標檢測,包括數(shù)字相機的生物識別和自動對焦功能。算法檢測和驗證面部特征的存在。例如,眼睛在灰度圖像中顯示為谷地。

醫(yī)學影像

從醫(yī)學影像中提取臨床相關信息。例如,放射學家可以使用機器學習來增強分析,通過將圖像分割成不同的器官、組織類型或疾病癥狀。這可以減少運行診斷測試所需的時間。

機器視覺

捕捉和處理圖像,為設備提供操作指導的應用。這包括工業(yè)和非工業(yè)的應用。機器視覺系統(tǒng)使用專用攝像機中的數(shù)字傳感器,使計算機硬件和軟件能夠測量、處理和分析圖像。例如,檢測系統(tǒng)為汽水瓶拍照,然后根據(jù)合格 - 不合格標準分析圖像,以確定瓶子是否被正確地填充。

視頻監(jiān)控 — 視頻跟蹤和運動目標跟蹤

這涉及到在視頻中定位移動物體。其用途包括安全和監(jiān)視、交通控制、人機交互和視頻編輯。

自動駕駛

自動駕駛汽車必須能夠感知和理解他們的環(huán)境,以便安全駕駛。相關類別的對象包括其他車輛、建筑物和行人。語義分割使自動駕駛汽車能夠識別圖像中的哪些區(qū)域可以安全駕駛。

虹膜識別

一種能識別復雜虹膜圖案的生物特征識別技術。它使用自動模式識別來分析人眼的視頻圖像。

人臉識別

從視頻中識別個體。這項技術將從輸入圖像中選擇的面部特征與數(shù)據(jù)庫中的人臉進行比較。

零售圖像識別

這個應用讓零售商了解貨架上商品的布局。算法實時處理產品數(shù)據(jù),檢測貨架上是否有商品。如果有產品缺貨,他們可以找出原因,通知跟單員,并為供應鏈的相應部分推薦解決方案。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像識別
    +關注

    關注

    9

    文章

    527

    瀏覽量

    39105
  • 圖像分割
    +關注

    關注

    4

    文章

    182

    瀏覽量

    18339
  • 深度學習
    +關注

    關注

    73

    文章

    5561

    瀏覽量

    122793

原文標題:深度學習中的圖像分割:方法和應用

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    大模型推理顯存和計算量估計方法研究

    、顯存估計方法 基于模型結構的顯存估計 根據(jù)深度學習模型的層次結構和參數(shù)數(shù)量,可以估算模型在推理過程中所需的顯存大小。具體方法如下: (1)統(tǒng)計模型中各層參數(shù)數(shù)量,
    發(fā)表于 07-03 19:43

    第一章 W55MH32 高性能以太網單片機的學習方法概述

    本章介紹W55MH32的學習方法,建議先了解硬件資源,按基礎篇、入門篇循序漸進學習。參考兩份手冊,提供例程資料,還給出官網、github 等學習資料查找渠道。讓我們一起踏上W55MH32高性能以太網單片機的
    的頭像 發(fā)表于 05-26 09:07 ?92次閱讀
    第一章 W55MH32 高性能以太網單片機的<b class='flag-5'>學習方法</b>概述

    一種無刷直流電機霍耳信號與定子繞組關系自學習方法

    的關系。提出了一種無刷直流電機霍耳信號與定子繞組關系自學習方法,該方法通過不同的繞組通電組合將電機轉子依次轉到6個不同的位置并記錄對應的霍耳信號,然后得出霍耳信號與定子繞組的對應關系。所提出的方法快速
    發(fā)表于 03-25 15:15

    DeepSeek與Kimi揭示o1秘密,思維鏈學習方法顯成效

    據(jù)消息,OpenAI近日發(fā)布了一項重要研究報告。報告指出,DeepSeek和Kimi兩家機構通過獨立研究,成功利用思維鏈學習方法,在數(shù)學解題與編程挑戰(zhàn)中顯著提升了模型的綜合表現(xiàn)。 Kimi的研究員
    的頭像 發(fā)表于 02-18 15:13 ?467次閱讀

    傳統(tǒng)機器學習方法和應用指導

    用于開發(fā)生物學數(shù)據(jù)的機器學習方法。盡管深度學習(一般指神經網絡算法)是一個強大的工具,目前也非常流行,但它的應用領域仍然有限。與深度學習相比
    的頭像 發(fā)表于 12-30 09:16 ?1184次閱讀
    <b class='flag-5'>傳統(tǒng)</b>機器<b class='flag-5'>學習方法</b>和應用指導

    激光焊縫跟蹤器與傳統(tǒng)焊縫檢測方法的對比

    在焊接自動化的推動下,焊縫檢測技術逐漸成為焊接質量控制的重要環(huán)節(jié)。傳統(tǒng)的焊縫檢測方法在一定程度上滿足了生產需求,但隨著工業(yè)應用對精度和效率要求的提升,激光焊縫跟蹤器逐漸成為一種更具競爭力的解決方案。今天一起了解激光焊縫跟蹤器與傳統(tǒng)
    的頭像 發(fā)表于 11-28 16:47 ?602次閱讀
    激光焊縫跟蹤器與<b class='flag-5'>傳統(tǒng)</b>焊縫檢測<b class='flag-5'>方法</b>的對比

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統(tǒng)具有人的學習能力以便實現(xiàn)人工智能。因為沒有學習能力的系統(tǒng)很難被認為是具有智能的。目前被廣泛采用的機器學習的定義是“利用經
    的頭像 發(fā)表于 11-16 01:07 ?963次閱讀
    什么是機器<b class='flag-5'>學習</b>?通過機器<b class='flag-5'>學習方法</b>能解決哪些問題?

    基于LSTM神經網絡的情感分析方法

    情感分析是自然語言處理(NLP)領域的一項重要任務,旨在識別和提取文本中的主觀信息,如情感傾向、情感強度等。隨著深度學習技術的發(fā)展,基于LSTM(長短期記憶)神經網絡的情感分析方法因其出色的序列建模
    的頭像 發(fā)表于 11-13 10:15 ?1273次閱讀

    EDA與傳統(tǒng)設計方法的區(qū)別

    : EDA工具通過軟件自動化大部分設計流程,包括電路設計、仿真、驗證和布局布線等。這種自動化不僅提高了設計效率,還減少了人為錯誤的可能性。 傳統(tǒng)方法傳統(tǒng)設計
    的頭像 發(fā)表于 11-08 13:47 ?1334次閱讀

    Pytorch深度學習訓練的方法

    掌握這 17 種方法,用最省力的方式,加速你的 Pytorch 深度學習訓練。
    的頭像 發(fā)表于 10-28 14:05 ?653次閱讀
    Pytorch<b class='flag-5'>深度</b><b class='flag-5'>學習</b>訓練的<b class='flag-5'>方法</b>

    電子封裝 | Die Bonding 芯片鍵合的主要方法和工藝

    傳統(tǒng)方法和先進方法。傳統(tǒng)方法包括晶片連接和電線連接,而先進的
    的頭像 發(fā)表于 09-20 08:04 ?1928次閱讀
    電子封裝 | Die Bonding 芯片鍵合的主要<b class='flag-5'>方法</b>和工藝

    深度識別算法包括哪些內容

    深度識別算法是深度學習領域的一個重要組成部分,它利用深度神經網絡模型對輸入數(shù)據(jù)進行高層次的理解和識別。深度識別算法涵蓋了多個方面的內容,主要
    的頭像 發(fā)表于 09-10 15:28 ?835次閱讀

    圖像語義分割的實用性是什么

    什么是圖像語義分割 圖像語義分割是一種將圖像中的所有像素點按照其語義類別進行分類的任務。與傳統(tǒng)
    的頭像 發(fā)表于 07-17 09:56 ?915次閱讀

    圖像分割和語義分割的區(qū)別與聯(lián)系

    圖像分割和語義分割是計算機視覺領域中兩個重要的概念,它們在圖像處理和分析中發(fā)揮著關鍵作用。 1. 圖像
    的頭像 發(fā)表于 07-17 09:55 ?1952次閱讀

    圖像分割與目標檢測的區(qū)別是什么

    圖像分割與目標檢測是計算機視覺領域的兩個重要任務,它們在許多應用場景中都發(fā)揮著關鍵作用。然而,盡管它們在某些方面有相似之處,但它們的目標、方法和應用場景有很大的不同。本文將介紹圖像
    的頭像 發(fā)表于 07-17 09:53 ?2354次閱讀