一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于卷積神經(jīng)網(wǎng)絡(luò)的垃圾圖像分類模型

新機(jī)器視覺 ? 來源:計(jì)算機(jī)系統(tǒng)應(yīng)用 ? 作者:計(jì)算機(jī)系統(tǒng)應(yīng)用 ? 2020-12-31 09:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

垃圾分類作為資源回收利用的重要環(huán)節(jié)之一, 可以有效地提高資源回收利用效率, 進(jìn)一步減輕環(huán)境污染帶 來的危害。 隨著現(xiàn)代工業(yè)逐步智能化, 傳統(tǒng)的圖像分類算法已經(jīng)不能滿足垃圾分揀設(shè)備的要求。 本文提出一種基于 卷積神經(jīng)網(wǎng)絡(luò)的垃圾圖像分類模型 (Garbage Classification Network, GCNet)。 通過構(gòu)建注意力機(jī)制, 模型完成局部 和全局的特征提取, 能夠獲取到更加完善、有效的特征信息; 同時(shí), 通過特征融合機(jī)制, 將不同層級(jí)、尺寸的特征進(jìn) 行融合, 更加有效地利用特征, 避免梯度消失現(xiàn)象。 實(shí)驗(yàn)結(jié)果證明, GCNet 在相關(guān)垃圾分類數(shù)據(jù)集上取得了優(yōu)異的 結(jié)果, 能夠有效地提高垃圾識(shí)別精度。

1 引言

垃圾回收利用作為發(fā)展循環(huán)經(jīng)濟(jì)的必經(jīng)之路, 是 根治污染、提高環(huán)境治理效果的關(guān)鍵所在。 隨著我國 生產(chǎn)力水平的發(fā)展, 生活垃圾、工業(yè)垃圾數(shù)量不斷增 加, 困擾著很多城市。 據(jù)統(tǒng)計(jì), 僅 2018 年, 中國垃圾的 清運(yùn)量已經(jīng)達(dá)到了 2.28 億噸[1] 。 在人們將垃圾投放進(jìn)垃圾箱之后, 垃圾被運(yùn)送到垃圾處理廠統(tǒng)一處理。 當(dāng)前 國內(nèi)的垃圾處理廠, 更多依靠人工在流水線上作業(yè)去 分揀垃圾, 對作業(yè)者健康不利且分揀效率較低, 已不能 滿足大量垃圾處理需求。 此外, 人工分揀的垃圾種類極 為有限, 大部分垃圾無法重新回收利用, 造成很大浪費(fèi)。 隨著深度學(xué)習(xí)技術(shù)的發(fā)展, 卷積神經(jīng)網(wǎng)絡(luò)使圖像分類 算法在精度和速度上得到了巨大的提升, 讓我們看到 了借助視覺技術(shù)自動(dòng)分揀垃圾的可能性。 通過攝像頭 拍攝垃圾圖片, 利用卷積神經(jīng)網(wǎng)絡(luò)檢測出垃圾的類別, 之后就可以借助機(jī)械手或推板自動(dòng)完成分揀任務(wù), 可 以降低人工成本, 提高分揀效率。 因此, 開展垃圾圖像 分類算法的研究, 具有重要的應(yīng)用價(jià)值。

2 相關(guān)工作

早期, 學(xué)者們只能借助經(jīng)典的圖像分類算法[2–5] 完 成垃圾圖像分類任務(wù), 這要通過手動(dòng)提取的圖像特征 并結(jié)合相應(yīng)的分類器完成。 吳健等[6] 利用顏色和紋理 特征, 初步完成了廢物垃圾識(shí)別。 由于不同數(shù)據(jù)集的圖 像背景、尺寸、質(zhì)量不盡相同, 傳統(tǒng)算法需要根據(jù)相應(yīng)數(shù)據(jù)人工提取不同的特征, 算法的魯棒性較差, 并且 處理方式復(fù)雜, 所需時(shí)間較長, 無法達(dá)到實(shí)時(shí)的效果。 隨著卷積神經(jīng)網(wǎng)絡(luò) (Convolution Neural Network, CNN) 的飛速發(fā)展, 深度學(xué)習(xí)廣泛應(yīng)用于圖像識(shí)別領(lǐng) 域。

作為數(shù)據(jù)驅(qū)動(dòng)的算法, CNN 具有強(qiáng)大的特征擬合 能力, 可以有效、自動(dòng)地提取圖像特征, 并具有較快的 運(yùn)行速度。 2012 年, AlexNet[7] 取得了 ImageNet 圖像分 類競賽的冠軍, 標(biāo)志著深度學(xué)習(xí)的崛起。 隨后幾年, GoogleNet[8]、VGGNet[9]、ResNet[10] 等算法提升了圖像分類的精度, 并成功應(yīng)用于人臉識(shí)別、車輛檢測等 多個(gè)領(lǐng)域。 垃圾圖像分類, 在深度學(xué)習(xí)算法的幫助下同 樣取得了較大的突破。

斯坦福大學(xué)的 Yang 等建立了 TrashNet Dataset 公開數(shù)據(jù)集, 包含 6 個(gè)類別, 共計(jì) 2527 張圖片。 Ozkaya 等[11] 通過對比不同 CNN 網(wǎng)絡(luò)的 分類能力, 搭建神經(jīng)網(wǎng)絡(luò) (本文稱之為 TrashNet) 并進(jìn) 行參數(shù)微調(diào), 在數(shù)據(jù)集 TrashNet Dataset 上取得了 97.86% 的準(zhǔn)確率, 是目前這一數(shù)據(jù)集上最佳分類網(wǎng)絡(luò)。 在非公開數(shù)據(jù)集方面, Mittal 等[12] 自制了 2561 張的垃圾圖片 數(shù)據(jù)集 GINI, 使用 GarbNet 模型, 得到了 87.69% 的準(zhǔn) 確率。 國內(nèi)方面, 鄭海龍等[13] 用 SVM 方法進(jìn)行了建筑 垃圾分類方面的研究。 向偉等[14] 使用分類網(wǎng)絡(luò) CaffeNet, 調(diào)整卷積核尺寸和網(wǎng)絡(luò)深度, 使其適用于水面垃圾分 類, 在其自制的 1500 張圖片數(shù)據(jù)集上取得了 95.75% 的識(shí)別率。 2019 年, 華為舉辦垃圾圖像分類競賽, 構(gòu)建 了樣本容量為一萬余張的數(shù)據(jù)集, 進(jìn)一步促進(jìn)了該領(lǐng) 域的發(fā)展。

我國各地區(qū)生活垃圾分類標(biāo)準(zhǔn)有所不同, 大致可 分為可回收垃圾、有害垃圾、廚余垃圾和其他垃圾這 4 大類, 且每個(gè)類別下又包含若干子類別, 種類繁多且 十分復(fù)雜。 按照這樣的分類標(biāo)準(zhǔn)做的垃圾圖像識(shí)別研 究, 國內(nèi)目前還處于起步階段。 現(xiàn)有的圖形分類算法在 垃圾處理領(lǐng)域的應(yīng)用較少, 且存在準(zhǔn)確率不足、泛化 性能差、處理效率低的缺點(diǎn)。 針對現(xiàn)有方法的不足, 本 文提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的垃圾圖像分類算法 (Garbage Classification Net, GCNet), 在網(wǎng)絡(luò)結(jié)構(gòu)中融合 了注意力機(jī)制模塊與特征融合模塊, 提高了模型在垃 圾分類任務(wù)上的準(zhǔn)確性與魯棒性。

3 算法設(shè)計(jì)

3.1 模型結(jié)構(gòu)

本文構(gòu)建的 GCNet 模型包括特征提取器、分類 器兩部分, 整體結(jié)構(gòu)如圖 1 所示。 圖中特征提取器由 Resnet101 作為主干部分, 共包括 5 個(gè) bottleneck, 并在 不同的 bottleneck 后加入注意力機(jī)制模塊, 同時(shí)對不同 模塊提取到的特征進(jìn)行特征融合 (如圖 1 中虛線所示) 以從輸入 中提取圖像的特征信息 :

其中, Me表示特征提取器。 F1 yi 分類器由兩層全連接層和一個(gè) Softmax 分類器組 成, 對提取到的特征信息 進(jìn)行分類, 以得到圖像在每 個(gè)類別下的最終得分 :

其中, Mc表示分類器。

3.2 注意力機(jī)制

注意力機(jī)制源于對人類視覺的研究, 人類會(huì)根據(jù) 實(shí)際需要選擇視網(wǎng)膜內(nèi)特定區(qū)域進(jìn)行集中關(guān)注, 可以 將有限的處理資源分配至重要的部分。 由于相同類別 垃圾的特征表征差異性可能較大, 不利于圖片的正確 分類, 這就要求準(zhǔn)確地關(guān)注圖像中的顯著區(qū)域。 受這一 思想的啟發(fā), 通過構(gòu)建注意力機(jī)制模塊, 使網(wǎng)絡(luò)模型重 點(diǎn)關(guān)注有利于分類的特征區(qū)域, 以實(shí)現(xiàn)更好的特征提 取功能, 其具體結(jié)構(gòu)如圖 2 所示。

5 結(jié)論

本文針對垃圾圖像分類問題, 構(gòu)建了一種基于卷 積神經(jīng)網(wǎng)絡(luò)的算法 GCNet, 該網(wǎng)絡(luò)通過構(gòu)建注意力機(jī) 制和特征融合機(jī)制, 能夠有效地提取圖像特征、降低 類別差異性帶來的影響, 并在相關(guān)數(shù)據(jù)集上取得了 96.73% 的平均準(zhǔn)確率, 相較于現(xiàn)有的分類算法提升了 約 4% 的準(zhǔn)確率, 滿足了實(shí)際的應(yīng)用需求, 具有良好的 應(yīng)用前景。

原文標(biāo)題:基于卷積神經(jīng)網(wǎng)絡(luò)的垃圾圖像分類算法

文章出處:【微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:基于卷積神經(jīng)網(wǎng)絡(luò)的垃圾圖像分類算法

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    BP神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)的比較

    BP神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)在多個(gè)方面存在顯著差異,以下是對兩者的比較: 一、結(jié)構(gòu)特點(diǎn) BP神經(jīng)網(wǎng)絡(luò) : BP神經(jīng)網(wǎng)絡(luò)是一種多層的前饋
    的頭像 發(fā)表于 02-12 15:53 ?667次閱讀

    人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法

    在上一篇文章中,我們介紹了傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)和多種算法。在本文中,我們會(huì)介紹人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法,供各位老師選擇。 01 人工神經(jīng)網(wǎng)絡(luò) ? 人工神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 01-09 10:24 ?1189次閱讀
    人工<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的原理和多種<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>架構(gòu)方法

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測模型

    通道數(shù)時(shí)表現(xiàn)更好。 2.3 神經(jīng)網(wǎng)絡(luò)的相關(guān)知識(shí)點(diǎn) 2.3.1 卷積的基本概念 卷積是一種數(shù)學(xué)運(yùn)算,在計(jì)算機(jī)視覺中被廣泛應(yīng)用于特征提取。它通過一個(gè)小型矩陣(稱為卷積核或?yàn)V波器)與輸入
    發(fā)表于 12-19 14:33

    卷積神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)工具與框架

    卷積神經(jīng)網(wǎng)絡(luò)因其在圖像和視頻處理任務(wù)中的卓越性能而廣受歡迎。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,多種實(shí)現(xiàn)工具和框架應(yīng)運(yùn)而生,為研究人員和開發(fā)者提供了強(qiáng)大的支持。 TensorFlow 概述
    的頭像 發(fā)表于 11-15 15:20 ?671次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)調(diào)整方法

    卷積神經(jīng)網(wǎng)絡(luò)因其在處理具有空間層次結(jié)構(gòu)的數(shù)據(jù)時(shí)的卓越性能而受到青睞。然而,CNN的成功很大程度上依賴于其參數(shù)的合理設(shè)置。參數(shù)調(diào)整是一個(gè)復(fù)雜的過程,涉及到多個(gè)超參數(shù)的選擇和優(yōu)化。 網(wǎng)絡(luò)架構(gòu)參數(shù)
    的頭像 發(fā)表于 11-15 15:10 ?1208次閱讀

    使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像分類的步驟

    使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行圖像分類是一個(gè)涉及多個(gè)步驟的過程。 1. 問題定義 確定目標(biāo) :明確你想要分類
    的頭像 發(fā)表于 11-15 15:01 ?848次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)在自然語言處理中的應(yīng)用

    自然語言處理是人工智能領(lǐng)域的一個(gè)重要分支,它致力于使計(jì)算機(jī)能夠理解、解釋和生成人類語言。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(CNNs)作為一種強(qiáng)大的模型,在圖像識(shí)別和語音處理等領(lǐng)域取
    的頭像 發(fā)表于 11-15 14:58 ?807次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的比較

    在深度學(xué)習(xí)領(lǐng)域,神經(jīng)網(wǎng)絡(luò)模型被廣泛應(yīng)用于各種任務(wù),如圖像識(shí)別、自然語言處理和游戲智能等。其中,卷積神經(jīng)網(wǎng)絡(luò)(CNNs)和傳統(tǒng)
    的頭像 發(fā)表于 11-15 14:53 ?1870次閱讀

    深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)模型

    卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),其靈感來源于生物的視覺皮層機(jī)制。它通過模擬人類視覺系統(tǒng)的處理方式,能夠自動(dòng)提取圖像特征,從而在圖像識(shí)別和
    的頭像 發(fā)表于 11-15 14:52 ?846次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本原理與算法

    ),是深度學(xué)習(xí)的代表算法之一。 一、基本原理 卷積運(yùn)算 卷積運(yùn)算是卷積神經(jīng)網(wǎng)絡(luò)的核心,用于提取圖像中的局部特征。 定義
    的頭像 發(fā)表于 11-15 14:47 ?1782次閱讀

    LSTM神經(jīng)網(wǎng)絡(luò)圖像處理中的應(yīng)用

    長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),它能夠?qū)W習(xí)長期依賴關(guān)系。雖然LSTM最初是為處理序列數(shù)據(jù)設(shè)計(jì)的,但近年來,它在圖像處理領(lǐng)域也展現(xiàn)出了巨大的潛力。 LSTM基本原理
    的頭像 發(fā)表于 11-13 10:12 ?1618次閱讀

    關(guān)于卷積神經(jīng)網(wǎng)絡(luò),這些概念你厘清了么~

    取特征的強(qiáng)大工具,例如識(shí)別音頻信號(hào)或圖像信號(hào)中的復(fù)雜模式就是其應(yīng)用之一。 1、什么是卷積神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是一種由神經(jīng)元組成的系統(tǒng)或結(jié)構(gòu)
    發(fā)表于 10-24 13:56

    【飛凌嵌入式OK3576-C開發(fā)板體驗(yàn)】RKNN神經(jīng)網(wǎng)絡(luò)-車牌識(shí)別

    LPRNet基于深層神經(jīng)網(wǎng)絡(luò)設(shè)計(jì),通過輕量級(jí)的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)車牌識(shí)別。它采用端到端的訓(xùn)練方式,不依賴字符分割,能夠直接處理整張車牌圖像,并輸出最終的字符序列。這種設(shè)計(jì)提高了識(shí)別的實(shí)時(shí)
    發(fā)表于 10-10 16:40

    UNet模型屬于哪種神經(jīng)網(wǎng)絡(luò)

    U-Net模型屬于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)的一種特殊形式 。它最初由德國弗萊堡大學(xué)計(jì)算機(jī)科學(xué)系的研究人員在2015年提出,專為生物醫(yī)學(xué)
    的頭像 發(fā)表于 07-24 10:59 ?5549次閱讀

    如何構(gòu)建多層神經(jīng)網(wǎng)絡(luò)

    構(gòu)建多層神經(jīng)網(wǎng)絡(luò)(MLP, Multi-Layer Perceptron)模型是一個(gè)在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域廣泛使用的技術(shù),尤其在處理分類和回歸問題時(shí)。在本文中,我們將深入探討如何從頭開始構(gòu)建一個(gè)多層
    的頭像 發(fā)表于 07-19 17:19 ?1565次閱讀