一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用圖卷積網(wǎng)絡(luò)解決語(yǔ)義分割問(wèn)題

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來(lái)源:通信信號(hào)處理研究所 ? 2020-05-13 15:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

使用 CNN 處理圖像問(wèn)題已經(jīng)是常規(guī)操作,但此類方法會(huì)造成局部位置信息的損失。如何解決這個(gè)問(wèn)題呢?來(lái)自中科院自動(dòng)化所和北京中醫(yī)藥大學(xué)的研究者另辟蹊徑,提出用圖卷積網(wǎng)絡(luò)解決語(yǔ)義分割問(wèn)題。

論文鏈接:https://arxiv.org/pdf/2001.00335.pdf 使用深度學(xué)習(xí)執(zhí)行語(yǔ)義分割在圖像像素分類方面取得了巨大進(jìn)步。但是,深度學(xué)習(xí)提取高級(jí)特征時(shí)往往忽略了局部位置信息(local location information),而這對(duì)于圖像語(yǔ)義分割而言非常重要。 為了避免上述問(wèn)題,來(lái)自中科院自動(dòng)化所、北京中醫(yī)藥大學(xué)的研究者們提出一個(gè)執(zhí)行圖像語(yǔ)義分割任務(wù)的圖模型 Graph-FCN,該模型由全卷積網(wǎng)絡(luò)(FCN)進(jìn)行初始化。 首先,通過(guò)卷積網(wǎng)絡(luò)將圖像網(wǎng)格數(shù)據(jù)擴(kuò)展至圖結(jié)構(gòu)數(shù)據(jù),這樣就把語(yǔ)義分割問(wèn)題轉(zhuǎn)換成了圖節(jié)點(diǎn)分類問(wèn)題;然后,使用圖卷積網(wǎng)絡(luò)解決圖節(jié)點(diǎn)分類問(wèn)題。 研究者稱,這是首次將圖卷積網(wǎng)絡(luò)用于圖像語(yǔ)義分割的嘗試。該方法在 VOC 數(shù)據(jù)集上獲得了有競(jìng)爭(zhēng)力的 mIOU 性能,相比原始 FCN 模型有 1.34% 的性能提升。

Graph-FCN 架構(gòu)圖。

語(yǔ)義分割問(wèn)題的難點(diǎn) 語(yǔ)義分割是計(jì)算機(jī)視覺(jué)領(lǐng)域中的重要課題,其復(fù)雜程度超過(guò)分類和檢測(cè)任務(wù)。這項(xiàng)密集預(yù)測(cè)任務(wù)需要預(yù)測(cè)每個(gè)像素的類別,也就是說(shuō)它需要從高級(jí)語(yǔ)義信息和局部位置信息中學(xué)習(xí)目標(biāo)輪廓、目標(biāo)位置和目標(biāo)類別。 基于深度學(xué)習(xí)的語(yǔ)義分割方法,具體而言即卷積神經(jīng)網(wǎng)絡(luò)(CNN),為該領(lǐng)域帶來(lái)了一系列巨大進(jìn)展。提取高級(jí)特征的強(qiáng)大泛化能力使得圖像分類和檢測(cè)任務(wù)取得了非常好的性能,但伴隨泛化而來(lái)的局部位置信息損失則為密集預(yù)測(cè)任務(wù)增加了難度。具備較大感受野的高級(jí)語(yǔ)義信息對(duì)應(yīng)卷積神經(jīng)網(wǎng)絡(luò)中的小型特征圖,這類圖會(huì)造成像素級(jí)局部位置信息的損失。 多種基于深度學(xué)習(xí)的方法對(duì)該問(wèn)題帶來(lái)了改進(jìn),如全卷積網(wǎng)絡(luò) [16]、Segent [1]、Deeplab 方法 [2,3,4]。這些工作使用全連接層、空洞卷積和金字塔結(jié)構(gòu),來(lái)減少提取高級(jí)特征過(guò)程中的位置信息損失。 中科院等提出語(yǔ)義分割難題新解法 首先,研究者為圖像語(yǔ)義分割問(wèn)題構(gòu)建圖節(jié)點(diǎn)模型。圖模型方法廣泛應(yīng)用于分割問(wèn)題,這類方法將像素視作節(jié)點(diǎn),將節(jié)點(diǎn)之間的差異度(dissimilarity)視作邊(edge)。最優(yōu)的分割即對(duì)圖執(zhí)行最大割(maximum cut)。 結(jié)合了概率論和圖論的概率圖模型方法(如馬爾可夫隨機(jī)場(chǎng)和條件隨機(jī)場(chǎng))被用于細(xì)化語(yǔ)義分割結(jié)果。這些方法將檢測(cè)到的目標(biāo)建模為圖節(jié)點(diǎn),通過(guò)提取目標(biāo)之間的關(guān)系來(lái)改進(jìn)檢測(cè)準(zhǔn)確率。相比于深度卷積模型把輸入數(shù)據(jù)表示為網(wǎng)格結(jié)構(gòu),圖模型具備更靈活的跳躍連接(skip connection),因此它可以探索圖中節(jié)點(diǎn)之間的關(guān)系。 受限于計(jì)算量,研究者使用 FCN 初始化該圖模型。該圖模型基于小尺寸圖像構(gòu)建,其節(jié)點(diǎn)標(biāo)注由 FCN 進(jìn)行初始化,邊的權(quán)重則由高斯核函數(shù)進(jìn)行初始化。

圖 1:FCN 結(jié)構(gòu)示意圖。本研究使用 FCN-16s 作為基礎(chǔ)模型對(duì)節(jié)點(diǎn)標(biāo)注進(jìn)行初始化。 然后使用圖卷積網(wǎng)絡(luò)(GCN)解決這個(gè)圖模型。GCN 是處理圖結(jié)構(gòu)數(shù)據(jù)的當(dāng)前最優(yōu)模型之一?;诠?jié)點(diǎn)的 GCN 利用消息傳播(message propagation)來(lái)交換相鄰節(jié)點(diǎn)之間的信息。這一過(guò)程可以在圖的較大相鄰范圍內(nèi)提取特征,其作用類似于卷積網(wǎng)絡(luò)中的卷積層和池化層。由于該過(guò)程中不會(huì)有節(jié)點(diǎn)消失,因此基于節(jié)點(diǎn)的 GCN 擴(kuò)展了感受野,并避免了局部位置信息出現(xiàn)損失。 這篇論文提出了新型模型 Graph-FCN 來(lái)解決語(yǔ)義分割問(wèn)題。研究者使用深度卷積網(wǎng)絡(luò)建模圖,并首次用 GCN 方法解決圖像語(yǔ)義分割任務(wù)。Graph-FCN 可以擴(kuò)大感受野,同時(shí)避免局部位置信息出現(xiàn)損失。實(shí)驗(yàn)表明,Graph-FCN 的性能優(yōu)于 FCN。 Graph-FCN 方法詳解 GCN 旨在解決圖結(jié)構(gòu)數(shù)據(jù)集上的學(xué)習(xí)問(wèn)題。圖結(jié)構(gòu)數(shù)據(jù)可看作是三元組 G(N, E, U),其中 N 表示圖的節(jié)點(diǎn)集合,即 |N| ? S 矩陣(|N| 表示圖節(jié)點(diǎn)數(shù)量,S 表示節(jié)點(diǎn)標(biāo)注向量的維度)。E 是圖的邊集合。U 對(duì)應(yīng)圖特征,由于本研究涉及任務(wù)與 U 無(wú)關(guān),因此本研究不討論 U。 與歐幾里德空間中的數(shù)據(jù)表示不同,矩陣 N 和邊 E 并非獨(dú)特表示。矩陣 N 與 E 對(duì)應(yīng),它們都按照節(jié)點(diǎn)的順序排列。研究者使用監(jiān)督學(xué)習(xí)方式訓(xùn)練模型。節(jié)點(diǎn) n_j 表示圖 j 中的節(jié)點(diǎn)集,t_j 表示節(jié)點(diǎn)集 n_j 的標(biāo)注集。因此用于語(yǔ)義分割任務(wù)的圖模型可公式化為:

研究者將交叉熵函數(shù)作為該模型的損失函數(shù)。T_r 表示訓(xùn)練集。 節(jié)點(diǎn) 在本研究提出的新模型中,節(jié)點(diǎn)標(biāo)注由 FCN-16s 進(jìn)行初始化。通過(guò)端到端訓(xùn)練后,F(xiàn)CN-16s 得到步幅為 16 和 32 的特征圖,如下圖 2 所示。對(duì)步幅為 16 的特征圖執(zhí)行因子為 2 的上采樣可以獲得與步幅為 32 的特征圖一樣的大小。(節(jié)點(diǎn) j 的)標(biāo)注 x_j 由這兩個(gè)特征向量以及特征圖中每個(gè)節(jié)點(diǎn)位置的級(jí)聯(lián)進(jìn)行初始化。該標(biāo)注包含在局部感受野上提取到的特征。在訓(xùn)練過(guò)程中,研究者通過(guò)對(duì)原始標(biāo)注圖像執(zhí)行池化操作來(lái)得到節(jié)點(diǎn)標(biāo)簽。

圖 2:節(jié)點(diǎn)標(biāo)注初始化過(guò)程。節(jié)點(diǎn)標(biāo)注由 FCN-16s 中兩個(gè)層的級(jí)聯(lián)進(jìn)行初始化。 邊 在圖模型中,邊和鄰接矩陣相關(guān)。假設(shè)每個(gè)節(jié)點(diǎn)和其最鄰近的 l 個(gè)節(jié)點(diǎn)相連,這意味著節(jié)點(diǎn)標(biāo)注可以通過(guò)圖神經(jīng)網(wǎng)絡(luò)中的邊進(jìn)行遷移。下圖 3 中的示例描述了圖神經(jīng)網(wǎng)絡(luò)中的感受野。假設(shè) l 為 4,那么從相關(guān)距離的影響來(lái)看,我們需要用高斯核函數(shù)獲得權(quán)重鄰接矩陣 A。

圖 3:當(dāng) l 為 4 時(shí),雙層 GCN 的感受野。這與卷積層不同。 使用 Graph-FCN 進(jìn)行訓(xùn)練 在 Graph-FCN 中,F(xiàn)CN-16s 實(shí)現(xiàn)節(jié)點(diǎn)分類和圖模型在小型特征圖中的初始化。同時(shí),雙層 GCN 獲取圖中節(jié)點(diǎn)的分類結(jié)果。研究者分別計(jì)算這兩部分輸出的交叉熵?fù)p失。和 FCN-16s 模型一樣,Graph-FCN 也以端到端模式進(jìn)行訓(xùn)練。Graph-FCN 網(wǎng)絡(luò)結(jié)構(gòu)如下圖 4 所示:

圖 4:Graph-FCN 的結(jié)構(gòu)示意圖。該模型有兩個(gè)輸出和兩個(gè)損失 L1 和 L2。它們共享卷積層提取特征的權(quán)重。L1 通過(guò) output1 計(jì)算得到,L2 通過(guò) output2 計(jì)算得到。通過(guò)最小化 L1 和 L2,F(xiàn)CN-16s 的性能得到了提升。 實(shí)驗(yàn) 研究者在 VOC2012 數(shù)據(jù)集上對(duì)模型進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果表明 Graph-FCN 的性能優(yōu)于原始 FCN 模型。

表 1:Graph-FCN 和 FCN-16s 的性能對(duì)比情況。

圖 5:圖像語(yǔ)義分割結(jié)果。第二列是 Graph-FCN 的結(jié)果,第三列是 FCN-16s 的結(jié)果,第四列是 ground truth。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:另辟蹊徑,中科院自動(dòng)化所等首次用圖卷積網(wǎng)絡(luò)解決語(yǔ)義分割難題

文章出處:【微信號(hào):tyutcsplab,微信公眾號(hào):智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    卷積神經(jīng)網(wǎng)絡(luò)如何監(jiān)測(cè)皮帶堵料情況 #人工智能

    卷積神經(jīng)網(wǎng)絡(luò)
    jf_60804796
    發(fā)布于 :2025年07月01日 17:08:42

    如何使用MATLAB實(shí)現(xiàn)一維時(shí)間卷積網(wǎng)絡(luò)

    本文對(duì)一維卷積操作進(jìn)行介紹,包括一維擴(kuò)展卷積和一維因果卷積,以及 MATLAB 對(duì)一維卷積的支持情況。在最后通過(guò)一個(gè)實(shí)例演示如何在 MATLAB 中將一維
    的頭像 發(fā)表于 03-07 09:15 ?1083次閱讀
    如何使用MATLAB實(shí)現(xiàn)一維時(shí)間<b class='flag-5'>卷積</b><b class='flag-5'>網(wǎng)絡(luò)</b>

    BP神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)的比較

    BP神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)在多個(gè)方面存在顯著差異,以下是對(duì)兩者的比較: 一、結(jié)構(gòu)特點(diǎn) BP神經(jīng)網(wǎng)絡(luò) : BP神經(jīng)網(wǎng)絡(luò)是一種多層的前饋神經(jīng)
    的頭像 發(fā)表于 02-12 15:53 ?673次閱讀

    SparseViT:以非語(yǔ)義為中心、參數(shù)高效的稀疏化視覺(jué)Transformer

    (IML)都遵循“語(yǔ)義分割主干網(wǎng)絡(luò)”與“精心制作的手工制作非語(yǔ)義特征提取”相結(jié)合的設(shè)計(jì),這種方法嚴(yán)重限制了模型在未知場(chǎng)景的偽影提取能力。 論文標(biāo)題: Can We Get Rid
    的頭像 發(fā)表于 01-15 09:30 ?465次閱讀
    SparseViT:以非<b class='flag-5'>語(yǔ)義</b>為中心、參數(shù)高效的稀疏化視覺(jué)Transformer

    卷積神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)工具與框架

    卷積神經(jīng)網(wǎng)絡(luò)因其在圖像和視頻處理任務(wù)中的卓越性能而廣受歡迎。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,多種實(shí)現(xiàn)工具和框架應(yīng)運(yùn)而生,為研究人員和開(kāi)發(fā)者提供了強(qiáng)大的支持。 TensorFlow 概述
    的頭像 發(fā)表于 11-15 15:20 ?672次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)調(diào)整方法

    卷積神經(jīng)網(wǎng)絡(luò)因其在處理具有空間層次結(jié)構(gòu)的數(shù)據(jù)時(shí)的卓越性能而受到青睞。然而,CNN的成功很大程度上依賴于其參數(shù)的合理設(shè)置。參數(shù)調(diào)整是一個(gè)復(fù)雜的過(guò)程,涉及到多個(gè)超參數(shù)的選擇和優(yōu)化。 網(wǎng)絡(luò)架構(gòu)參數(shù)
    的頭像 發(fā)表于 11-15 15:10 ?1212次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)在自然語(yǔ)言處理中的應(yīng)用

    自然語(yǔ)言處理是人工智能領(lǐng)域的一個(gè)重要分支,它致力于使計(jì)算機(jī)能夠理解、解釋和生成人類語(yǔ)言。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(CNNs)作為一種強(qiáng)大的模型,在圖像識(shí)別和語(yǔ)音處理等領(lǐng)域取得了顯著成果
    的頭像 發(fā)表于 11-15 14:58 ?807次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的比較

    在深度學(xué)習(xí)領(lǐng)域,神經(jīng)網(wǎng)絡(luò)模型被廣泛應(yīng)用于各種任務(wù),如圖像識(shí)別、自然語(yǔ)言處理和游戲智能等。其中,卷積神經(jīng)網(wǎng)絡(luò)(CNNs)和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)是兩種常見(jiàn)的模型。 1. 結(jié)構(gòu)差異 1.1 傳統(tǒng)神經(jīng)
    的頭像 發(fā)表于 11-15 14:53 ?1878次閱讀

    深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)模型

    深度學(xué)習(xí)近年來(lái)在多個(gè)領(lǐng)域取得了顯著的進(jìn)展,尤其是在圖像識(shí)別、語(yǔ)音識(shí)別和自然語(yǔ)言處理等方面。卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的一個(gè)分支,因其在圖像處理任務(wù)中的卓越性能而受到廣泛關(guān)注。 卷積神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 11-15 14:52 ?847次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本原理與算法

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Networks
    的頭像 發(fā)表于 11-15 14:47 ?1785次閱讀

    一種基于因果路徑的層次圖卷積注意力網(wǎng)絡(luò)

    機(jī)電系統(tǒng)中的故障檢測(cè)對(duì)其可維護(hù)性和安全性至關(guān)重要。然而,系統(tǒng)監(jiān)測(cè)變量往往具有復(fù)雜的聯(lián)系,很難表征它們的關(guān)系并提取有效的特征。本文開(kāi)發(fā)了一種基于因果路徑的層次圖卷積注意力網(wǎng)絡(luò)(HGCAN),以提高復(fù)雜
    的頭像 發(fā)表于 11-12 09:52 ?1072次閱讀
    一種基于因果路徑的層次<b class='flag-5'>圖卷積</b>注意力<b class='flag-5'>網(wǎng)絡(luò)</b>

    關(guān)于卷積神經(jīng)網(wǎng)絡(luò),這些概念你厘清了么~

    隨著人工智能(AI)技術(shù)的快速發(fā)展,AI可以越來(lái)越多地支持以前無(wú)法實(shí)現(xiàn)或者難以實(shí)現(xiàn)的應(yīng)用。本文基于此解釋了 卷積神經(jīng)網(wǎng)絡(luò) (CNN)及其對(duì)人工智能和機(jī)器學(xué)習(xí)的意義。CNN是一種能夠從復(fù)雜數(shù)據(jù)中提
    發(fā)表于 10-24 13:56

    語(yǔ)義分割25種損失函數(shù)綜述和展望

    語(yǔ)義圖像分割,即將圖像中的每個(gè)像素分類到特定的類別中,是許多視覺(jué)理解系統(tǒng)中的重要組成部分。作為評(píng)估統(tǒng)計(jì)模型性能的主要標(biāo)準(zhǔn),損失函數(shù)對(duì)于塑造基于深度學(xué)習(xí)的分割算法的發(fā)
    的頭像 發(fā)表于 10-22 08:04 ?1622次閱讀
    <b class='flag-5'>語(yǔ)義</b><b class='flag-5'>分割</b>25種損失函數(shù)綜述和展望

    高斯濾波的卷積核怎么確定

    高斯濾波的卷積核確定主要依賴于高斯函數(shù)的特性以及圖像處理的具體需求。以下是確定高斯濾波卷積核的幾個(gè)關(guān)鍵步驟: 一、確定卷積核的大小 卷積核形狀 :高斯濾波的
    的頭像 發(fā)表于 09-29 09:29 ?1693次閱讀

    UNet模型屬于哪種神經(jīng)網(wǎng)絡(luò)

    U-Net模型屬于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)的一種特殊形式 。它最初由德國(guó)弗萊堡大學(xué)計(jì)算機(jī)科學(xué)系的研究人員在2015年提出,專為生物醫(yī)學(xué)圖像
    的頭像 發(fā)表于 07-24 10:59 ?5558次閱讀