一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于MATLAB 圖像處理與深度學(xué)習(xí)的作用分析和介紹

MATLAB ? 來(lái)源:djl ? 2019-09-11 14:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文將展示如何通過(guò)圖像處理和深度學(xué)習(xí)來(lái)自動(dòng)解算數(shù)獨(dú)謎題:

圖中的紅色數(shù)字均由算法生成。接下來(lái)我們將介紹如何創(chuàng)建該算法,并說(shuō)明為何深度學(xué)習(xí)和圖像處理對(duì)于對(duì)象檢測(cè)和圖像分類(lèi)同樣十分有用。

圖像處理與深度學(xué)習(xí)

我們重點(diǎn)介紹兩種技術(shù):

圖像處理

按像素級(jí)別變換或者修改圖像。比如,過(guò)濾、模糊、去模糊和邊緣檢測(cè)等;

深度學(xué)習(xí)

通過(guò)學(xué)習(xí)樣本圖像自動(dòng)識(shí)別圖像特點(diǎn)。近幾年,深度學(xué)習(xí)已經(jīng)徹底改變了圖像處理領(lǐng)域。

我們來(lái)探討下這兩種技術(shù)之間的關(guān)聯(lián)性。這里有兩種常見(jiàn)的觀點(diǎn):

“深度學(xué)習(xí)已經(jīng)淘汰了‘傳統(tǒng)’的圖像處理方式。”

“深度學(xué)習(xí)需要數(shù)以百萬(wàn)的學(xué)習(xí)樣本,而且只能用于貓咪圖片識(shí)別這類(lèi)任務(wù)?!?/p>

但事實(shí)是:

深度學(xué)習(xí)和圖像處理都是非常有效的工具,可以解決各種難題,這些任務(wù)通常非常復(fù)雜,只有使用正確的工具才能解決問(wèn)題。

數(shù)獨(dú)解謎

解算數(shù)獨(dú)(如下圖所示)的規(guī)則是:需確保每一行、每一列,以及所有 3x3 宮格都只包含 1 到 9 這九個(gè)數(shù)字,并且不能有任何重復(fù),只有這樣才算完成。

關(guān)于MATLAB 圖像處理與深度學(xué)習(xí)的作用分析和介紹

數(shù)獨(dú)在開(kāi)始時(shí)會(huì)提供一些數(shù)字。填入數(shù)字的大小和數(shù)量將決定解謎的難度。

我們希望算法能夠識(shí)別出宮格,并填入答案。但如果只是這樣,未免太簡(jiǎn)單了點(diǎn)。我們還希望無(wú)論數(shù)獨(dú)位于圖片中的哪個(gè)位置,算法都能給出答案。這里有張照片,形象地展示了算法在解謎時(shí)可能需識(shí)別何種圖像:

為此,我們需要設(shè)計(jì)相應(yīng)的步驟來(lái)處理任務(wù)。這就意味著我們可以把解謎分成若干步驟:

關(guān)于MATLAB 圖像處理與深度學(xué)習(xí)的作用分析和介紹

找到數(shù)獨(dú)——在圖像中定位數(shù)獨(dú)

找到宮格——在 9x9 的盤(pán)面中確定所有宮格

識(shí)別數(shù)字——必須能夠識(shí)別手寫(xiě)或打印數(shù)字

解算數(shù)獨(dú)

以上所有步驟均可用深度學(xué)習(xí)或圖像處理中的一種方法來(lái)實(shí)現(xiàn)。那么,哪些步驟應(yīng)該用深度學(xué)習(xí)實(shí)現(xiàn),哪些步驟應(yīng)該用圖像處理來(lái)實(shí)現(xiàn)呢?

步驟1. 找到數(shù)獨(dú)

我們無(wú)法預(yù)計(jì)圖像、圖像背景和對(duì)象大小的情況。不同圖像的拍攝角度也可能大不相同。更不用說(shuō)光照、相機(jī)拍攝條件等其它因素??勺円蛩貙?shí)在是太多了。

適用方法:深度學(xué)習(xí)

讓我們?cè)囋嚹芊裼谜Z(yǔ)義分割為數(shù)獨(dú)圖片中的像素分類(lèi)。為此,我們需要標(biāo)記訓(xùn)練數(shù)據(jù)。在 MATLAB 中使用 Image Labeler 標(biāo)記需要的數(shù)據(jù)。這是標(biāo)記完成后的最終輸入數(shù)據(jù):

https://www.mathworks.cn/help/vision/examples/semantic-segmentation-using-deep-learning.html

有一點(diǎn)值得注意,那就是數(shù)據(jù)集非常小——只有一百幅左右的圖像。讓我們?cè)囍?xùn)練語(yǔ)義分割網(wǎng)絡(luò),看看數(shù)據(jù)是否充分。

設(shè)置圖像數(shù)據(jù)倉(cāng)庫(kù),以便儲(chǔ)存用于語(yǔ)義分割網(wǎng)絡(luò)的像素信息。

關(guān)于MATLAB 圖像處理與深度學(xué)習(xí)的作用分析和介紹

然后我們要設(shè)置網(wǎng)絡(luò)層。這里要注意,我們創(chuàng)建了一個(gè)能夠借助分類(lèi)權(quán)重使各個(gè)分類(lèi)抵消的函數(shù)。

設(shè)置網(wǎng)絡(luò):

關(guān)于MATLAB 圖像處理與深度學(xué)習(xí)的作用分析和介紹

這是訓(xùn)練選項(xiàng):

關(guān)于MATLAB 圖像處理與深度學(xué)習(xí)的作用分析和介紹

最后訓(xùn)練網(wǎng)絡(luò):

net = trainNetwork(train, layers, opts);

在這個(gè)階段中,大約需要 20 分鐘才能跑完 40 次樣本訓(xùn)練。具體耗時(shí)可能因電腦硬件/GPU 性能不同而有所差異。網(wǎng)絡(luò)經(jīng)過(guò)訓(xùn)練后,我們又換了一幅測(cè)試圖像,得出下述的結(jié)果:

結(jié)果很不錯(cuò)!盡管圖片中的其它格狀圖形對(duì)算法產(chǎn)生了干擾,但影響十分有限??稍谙聜€(gè)步驟去除這些小范圍噪點(diǎn)。

步驟2. 找到宮格

現(xiàn)在,我們需要在數(shù)獨(dú)盤(pán)面中識(shí)別出所有小宮格。這些宮格有著很明確的界定:筆直的邊線、總是深色的墨跡,以及大小一致的方形網(wǎng)格。在此提醒,我們?cè)诓襟E 1 中已經(jīng)確定了數(shù)獨(dú)盤(pán)面的大致區(qū)域。我們可以將該區(qū)域以外的圖像全部涂黑,確保算法集中處理該區(qū)域。

適用方法:圖像處理

我們?cè)啻翁接憟D像處理,如果你不是圖像處理領(lǐng)域的專(zhuān)家,你只要記住——這并不會(huì)妨礙你!MATLAB提供了各種應(yīng)用,能讓處理過(guò)程十分輕松。試試 Image Segmenter (https://www.mathworks.cn/help/images/ref/imagesegmenter-app.html),嘗試用它來(lái)檢測(cè)圖像中的宮格。下面這段代碼由該應(yīng)用自動(dòng)生成,可用于檢測(cè)圖像中的所有宮格。

首先需清理圖像,確保消除所有噪點(diǎn)。

BW_out = bwpropfilt(networkMask, 'Area', [100000 + eps(100000), Inf]);

然后要縮放遮罩,確保它覆蓋住整個(gè)盤(pán)面。

maskDilated = imdilate(BW_out, strel('disk', 120));

由于只需注意盤(pán)面所在區(qū)域,所以將其它區(qū)域全部涂黑。

grayIm = rgb2gray(im); grayIm(~maskDilated) = 0;

關(guān)于MATLAB 圖像處理與深度學(xué)習(xí)的作用分析和介紹

然后在圖像中精準(zhǔn)摳取盤(pán)面。

關(guān)于MATLAB 圖像處理與深度學(xué)習(xí)的作用分析和介紹

可以看到執(zhí)行的結(jié)果非常準(zhǔn)確,而且能夠經(jīng)受住各種干擾!

步驟3. 識(shí)別數(shù)字

有很多種方法可以識(shí)別手寫(xiě)數(shù)字和打印數(shù)字。這個(gè)問(wèn)題的難點(diǎn)在于,我們必須考慮到各種字號(hào)和字體。好在辦法也不少:

光學(xué)字符識(shí)別(OCR)是一種常見(jiàn)方法

結(jié)合了機(jī)器學(xué)習(xí)分類(lèi)器的方向梯度直方圖(HOG)是另一種方法點(diǎn)擊此處查看MATLAB示例

好在手寫(xiě)識(shí)別同樣是一個(gè)被廣泛研究的機(jī)器學(xué)習(xí)分類(lèi)問(wèn)題(請(qǐng)查看本示例,了解如何使用常見(jiàn)的MINST數(shù)據(jù)集來(lái)解決該問(wèn)題;我寫(xiě)過(guò)一篇類(lèi)似文章,請(qǐng)點(diǎn)擊此處閱讀)。

適用方法:深度學(xué)習(xí)

該環(huán)節(jié)旨在識(shí)別打印數(shù)字或手寫(xiě)數(shù)字,然后通過(guò)深度學(xué)習(xí)將其數(shù)字化(如下圖所示)。

關(guān)于MATLAB 圖像處理與深度學(xué)習(xí)的作用分析和介紹

為此,我們需要海量訓(xùn)練數(shù)據(jù)來(lái)幫助算法理解字符之間的差異??紤]到訓(xùn)練數(shù)據(jù)的海量程度,我們不可能手寫(xiě)出所有訓(xùn)練樣本,這太費(fèi)時(shí)間了。

這時(shí)即可借助 MATLAB 生成合成數(shù)據(jù)。就手寫(xiě)數(shù)字而言,這一步很簡(jiǎn)單——只需從MNIST數(shù)據(jù)集中提取現(xiàn)成數(shù)據(jù),然后與下圖中的背景圖像合成。在合成各類(lèi)打印數(shù)字時(shí),我們希望數(shù)字看上去盡可能不同,以便確保它們無(wú)論采用何種字體(新羅馬、維丹娜等),都能被算法識(shí)別。

關(guān)于MATLAB 圖像處理與深度學(xué)習(xí)的作用分析和介紹

在合成以上兩類(lèi)數(shù)字時(shí),我們會(huì)盡可能確保數(shù)字的大小和位置每次都不盡相同。因?yàn)檫@樣我們就能盡可能多地生成數(shù)據(jù)!

合成圖像:手寫(xiě)類(lèi)型/打印類(lèi)型

注:宮格的方框厚度同樣會(huì)隨機(jī)變厚或變薄,從而確保宮格各不相同。限于篇幅限制,本文對(duì)于合成數(shù)據(jù)的介紹十分有限。今后我會(huì)推出更多有關(guān)該主題的文章,請(qǐng)持續(xù)關(guān)注!

現(xiàn)在我們可以訓(xùn)練網(wǎng)絡(luò)了。設(shè)置訓(xùn)練選項(xiàng),創(chuàng)建層,然后像之前那樣訓(xùn)練網(wǎng)絡(luò)。

關(guān)于MATLAB 圖像處理與深度學(xué)習(xí)的作用分析和介紹

結(jié)果顯示,該網(wǎng)絡(luò)的準(zhǔn)確度約為97.8%。就數(shù)獨(dú)解算而言,這個(gè)結(jié)果已經(jīng)足夠精確了。

步驟4. 解算數(shù)獨(dú)

我們已經(jīng)識(shí)別了宮格和數(shù)字?,F(xiàn)在輪到填寫(xiě)答案了。

適用方法:都不需要!這是一個(gè)優(yōu)化問(wèn)題

整合各個(gè)步驟

現(xiàn)在我們已經(jīng)完成了所有四個(gè)步驟,借助深度學(xué)習(xí)和圖像處理創(chuàng)建了一個(gè)能夠?qū)ふ易顑?yōu)解的數(shù)獨(dú)解算器。

關(guān)于MATLAB 圖像處理與深度學(xué)習(xí)的作用分析和介紹

關(guān)于MATLAB 圖像處理與深度學(xué)習(xí)的作用分析和介紹

當(dāng)您在處理和圖像或視頻有關(guān)的任務(wù)時(shí),請(qǐng)務(wù)必牢記以下兩點(diǎn)重要提示:

深度學(xué)習(xí)適合解決某些問(wèn)題,但并非所有問(wèn)題都適合用深度學(xué)習(xí)解決。

圖像處理和深度學(xué)習(xí)都是十分有用的工具,可以將它們組合使用以便尋求最優(yōu)方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1329

    瀏覽量

    58039
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122789
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    進(jìn)群免費(fèi)領(lǐng)FPGA學(xué)習(xí)資料!數(shù)字信號(hào)處理、傅里葉變換與FPGA開(kāi)發(fā)等

    的基礎(chǔ)知識(shí),講述了確定性數(shù)字信號(hào)處理的知識(shí),包括離散時(shí)間信號(hào)及系統(tǒng)的介紹、z變換、傅里葉變換、頻率分析以及濾波器設(shè)計(jì)等。介紹了隨機(jī)數(shù)字信號(hào)處理
    發(fā)表于 04-07 16:41

    BP神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的關(guān)系

    BP神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)之間存在著密切的關(guān)系,以下是對(duì)它們之間關(guān)系的介紹: 一、BP神經(jīng)網(wǎng)絡(luò)的基本概念 BP神經(jīng)網(wǎng)絡(luò),即反向傳播神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network
    的頭像 發(fā)表于 02-12 15:15 ?850次閱讀

    DFT在圖像處理中的作用 DFT在音頻信號(hào)處理中的應(yīng)用

    處理中的幾個(gè)主要作用: 頻域?yàn)V波 :DFT允許我們分析圖像的頻率成分,從而可以設(shè)計(jì)濾波器來(lái)增強(qiáng)或抑制特定頻率的信號(hào),例如低通濾波器可以減少圖像
    的頭像 發(fā)表于 12-20 09:18 ?1252次閱讀

    Simulink與 MATLAB 的結(jié)合使用 Simulink中的信號(hào)處理方法

    被快速搭建和仿真。 MATLAB 在信號(hào)處理中的作用 MATLAB 是一個(gè)強(qiáng)大的數(shù)學(xué)計(jì)算工具,它提供了大量的內(nèi)置函數(shù)和工具箱,用于信號(hào)的生成、分析
    的頭像 發(fā)表于 12-12 09:25 ?1509次閱讀

    傅立葉變換在圖像處理中的作用

    傅里葉變換在圖像處理中發(fā)揮著至關(guān)重要的作用。以下是傅里葉變換在圖像處理中的幾個(gè)主要作用: 一、
    的頭像 發(fā)表于 12-06 16:55 ?2291次閱讀

    GPU在深度學(xué)習(xí)中的應(yīng)用 GPUs在圖形設(shè)計(jì)中的作用

    。 GPU的并行計(jì)算能力 GPU最初被設(shè)計(jì)用于處理圖形和圖像的渲染,其核心優(yōu)勢(shì)在于能夠同時(shí)處理成千上萬(wàn)的像素點(diǎn)。這種并行處理能力使得GPU非常適合執(zhí)行
    的頭像 發(fā)表于 11-19 10:55 ?1616次閱讀

    深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)模型

    深度學(xué)習(xí)近年來(lái)在多個(gè)領(lǐng)域取得了顯著的進(jìn)展,尤其是在圖像識(shí)別、語(yǔ)音識(shí)別和自然語(yǔ)言處理等方面。卷積神經(jīng)網(wǎng)絡(luò)作為深度
    的頭像 發(fā)表于 11-15 14:52 ?844次閱讀

    NPU在深度學(xué)習(xí)中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其核心驅(qū)動(dòng)力之一,已經(jīng)在眾多領(lǐng)域展現(xiàn)出了巨大的潛力和價(jià)值。NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò)處理單元)是專(zhuān)門(mén)為深度
    的頭像 發(fā)表于 11-14 15:17 ?1902次閱讀

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU在深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識(shí)別 圖像識(shí)別是
    的頭像 發(fā)表于 10-27 11:13 ?1353次閱讀

    激光雷達(dá)技術(shù)的基于深度學(xué)習(xí)的進(jìn)步

    信息。這使得激光雷達(dá)在自動(dòng)駕駛、無(wú)人機(jī)、機(jī)器人等領(lǐng)域具有廣泛的應(yīng)用前景。 二、深度學(xué)習(xí)技術(shù)的發(fā)展 深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,它通過(guò)模擬人
    的頭像 發(fā)表于 10-27 10:57 ?1061次閱讀

    AI大模型與深度學(xué)習(xí)的關(guān)系

    AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進(jìn),相輔相成。以下是對(duì)兩者關(guān)系的介紹: 一、深度學(xué)習(xí)是AI大模型的基礎(chǔ) 技術(shù)支撐 :
    的頭像 發(fā)表于 10-23 15:25 ?2879次閱讀

    AI大模型在圖像識(shí)別中的優(yōu)勢(shì)

    AI大模型在圖像識(shí)別中展現(xiàn)出了顯著的優(yōu)勢(shì),這些優(yōu)勢(shì)主要源于其強(qiáng)大的計(jì)算能力、深度學(xué)習(xí)算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對(duì)AI大模型在圖像識(shí)
    的頭像 發(fā)表于 10-23 15:01 ?2422次閱讀

    FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?

    中的性能和效率。同時(shí),也可能會(huì)出現(xiàn)一些新的基于 FPGA 的深度學(xué)習(xí)算法創(chuàng)新,拓展其應(yīng)用領(lǐng)域。 ? 應(yīng)用領(lǐng)域的拓展:除了在圖像識(shí)別、語(yǔ)音處理、自動(dòng)駕駛等領(lǐng)域的應(yīng)用,F(xiàn)PGA 在
    發(fā)表于 09-27 20:53

    深度識(shí)別算法包括哪些內(nèi)容

    :CNN是深度學(xué)習(xí)處理圖像和視頻等具有網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的主要算法。它通過(guò)卷積層、池化層和全連接層等組件,實(shí)現(xiàn)對(duì)圖像特征的自動(dòng)提取和識(shí)別。 應(yīng)
    的頭像 發(fā)表于 09-10 15:28 ?834次閱讀

    圖像識(shí)別算法都有哪些方法

    圖像識(shí)別算法是計(jì)算機(jī)視覺(jué)領(lǐng)域的核心任務(wù)之一,它涉及到從圖像中提取特征并進(jìn)行分類(lèi)、識(shí)別和分析的過(guò)程。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,
    的頭像 發(fā)表于 07-16 11:14 ?7467次閱讀