一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

淺析人工智能的卷積神經網絡與圖像處理

電子工程師 ? 來源:eetrend ? 作者:demi ? 2019-11-02 11:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能深度學習技術中,有一個很重要的概念就是卷積神經網絡 CNN(Convolutional Neural Networks)。

卷積神經網絡被廣泛地運用到計算機視覺中,用于提取圖像數據的特征,其中發(fā)揮關鍵作用的步驟就是卷積層中的卷積運算。

卷積到底是什么?深度學習中的卷積運算與傳統(tǒng)的信號與系統(tǒng)中的卷積算子有什么不同?為什么卷積運算可以提取圖像的特征呢?下3分鐘帶你讀懂卷積運算與圖像處理。

了解卷積運算

卷積神經網絡中的核心即為 卷積運算,其相當于圖像處理中的 濾波器運算。對于一個 m×n大小的卷積核:

卷積一詞最開始出現(xiàn)在信號與系統(tǒng)中,是指兩個原函數產生一個新的函數的一種算子。

卷積運算在運算過程可以概括為翻轉、平移再加權求和三個步驟,其中的加權求和就是乘加操作。

另外,卷積運算還有一個重要的特性:空間域卷積=頻域乘積,這一點可以解釋為什么卷積運算可以自動地提取圖像的特征。

在卷積神經網絡中,對數字圖像做卷積操作其實就是利用卷積核(黃底部分)在圖像(綠底部分)上滑動,將圖像上的像素灰度值與對應卷積核上的數值相乘,然后將所有相乘后的值相加作為此時的輸出值(紅底部分),并最終滑動遍歷完整副圖像的過程。

動圖來源于stanford.edu, Feature extraction using convolution

仔細觀察上述動圖,圖像中的卷積操作相比于信號與系統(tǒng)中的卷積少了點什么?

我們可以看到,圖像中卷積的計算過程只有平移和乘加兩個步驟,相對于信號與系統(tǒng)的卷積算子缺少了翻轉。

那么,圖像的卷積操作是否需要進行翻轉呢?

事實上,深度學習中卷積核是無需進行翻轉的,因為卷積核中的所有權重都是隨機初始化,開始不是確定的。網絡每次更新迭代都是為了尋找一個最合適的卷積核權重值,所以是否翻轉也就無關緊要了。除此之外,圖像處理中的卷積核一般是對稱的,翻轉也就顯得不那么必要。

卷積神經網絡被廣泛運用到計算機視覺的最大一個原因,就是卷積層可以自動地提取圖像特征。

提取圖像特征

圖像中的特征通常指代圖像中物體的輪廓與紋理信息,而通常物體的細節(jié)(可以簡單地理解為圖像中像素點灰度值變換緩慢的地方)帶來的信息量較少。我們通常所說的圖像特征提取的過程是在保留圖像輪廓和紋理的同時,去掉冗余信息的過程。

物體輪廓

物體紋理,圖片來源The Berkeley Segmentation Dataset and Benchmark

那么如何區(qū)分圖像的特征與圖像的冗余信息量呢?

如下面這幅人物圖像,如果我們不對原始圖像做處理,很難將圖像的特征與冗余信息量區(qū)分開來。

我們可以換一個角度,不從時空區(qū)域來區(qū)分,而是抓住圖像細節(jié)和圖像輪廓紋理的頻率不一樣這一特征,把一副圖像放在頻域中以區(qū)分圖像的細節(jié)與圖像的輪廓紋理。

我們將這幅人物圖像(左)轉換到頻域中的該圖像(右),離中心點越近的分量頻率越低,離中心點越遠的分量頻率越高。

原圖

頻域圖像,圖片來源CMU, Computational Photography, Fall 2019

現(xiàn)在我們將用一個模板來分離高低頻分量。

如左圖所示的模板1中,其數值取值范圍為0到1。模板中的點越黑其數值越接近于0,越白越接近于1.

將模板1與頻域圖像相乘后,就可以只保留高頻部分去除離中心點較近的低頻分量,再將圖像轉換回到空間域中,可以看到圖像的高頻分量(右)是輪廓和紋理特征。

模板1

高頻分量,圖片來源:CMU, Computational Photography, Fall 2019

同樣的操作方式,將模板2與頻域圖像相乘,頻域圖中的低頻分量可以被選取出來,再將低頻分量轉到空間域中,可以看到低頻分量代表著細節(jié)特征。這時我們就可以成功地將圖像的輪廓紋理細節(jié)信息從頻率的角度分開來了。

模板2

低頻分量,圖片來源CMU, Computational Photography, Fall 2019

以上處理過程,實際就是在頻域中將模板與頻域圖像相乘,以區(qū)分圖像輪廓紋理與細節(jié)信息的過程。

而頻域相乘就等于空間域卷積,這是剛才提及到的卷積的重要特性。那么上述在頻域中的操作等同于空間中的圖像與空間域中的模板做卷積,這樣從頻域的角度,就可以解釋卷積操作能夠提取圖像特征的原因。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103439
  • 人工智能
    +關注

    關注

    1806

    文章

    48984

    瀏覽量

    248899
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    BP神經網絡卷積神經網絡的比較

    BP神經網絡卷積神經網絡在多個方面存在顯著差異,以下是對兩者的比較: 一、結構特點 BP神經網絡 : BP神經網絡是一種多層的前饋
    的頭像 發(fā)表于 02-12 15:53 ?644次閱讀

    卷積神經網絡的實現(xiàn)工具與框架

    卷積神經網絡因其在圖像和視頻處理任務中的卓越性能而廣受歡迎。隨著深度學習技術的快速發(fā)展,多種實現(xiàn)工具和框架應運而生,為研究人員和開發(fā)者提供了強大的支持。 TensorFlow 概述
    的頭像 發(fā)表于 11-15 15:20 ?654次閱讀

    卷積神經網絡在自然語言處理中的應用

    自然語言處理人工智能領域的一個重要分支,它致力于使計算機能夠理解、解釋和生成人類語言。隨著深度學習技術的發(fā)展,卷積神經網絡(CNNs)作為一種強大的模型,在
    的頭像 發(fā)表于 11-15 14:58 ?785次閱讀

    卷積神經網絡與傳統(tǒng)神經網絡的比較

    在深度學習領域,神經網絡模型被廣泛應用于各種任務,如圖像識別、自然語言處理和游戲智能等。其中,卷積神經網
    的頭像 發(fā)表于 11-15 14:53 ?1838次閱讀

    深度學習中的卷積神經網絡模型

    深度學習近年來在多個領域取得了顯著的進展,尤其是在圖像識別、語音識別和自然語言處理等方面。卷積神經網絡作為深度學習的一個分支,因其在圖像
    的頭像 發(fā)表于 11-15 14:52 ?827次閱讀

    卷積神經網絡的基本原理與算法

    ),是深度學習的代表算法之一。 一、基本原理 卷積運算 卷積運算是卷積神經網絡的核心,用于提取圖像中的局部特征。 定義
    的頭像 發(fā)表于 11-15 14:47 ?1762次閱讀

    關于卷積神經網絡,這些概念你厘清了么~

    隨著人工智能(AI)技術的快速發(fā)展,AI可以越來越多地支持以前無法實現(xiàn)或者難以實現(xiàn)的應用。本文基于此解釋了 卷積神經網絡 (CNN)及其對人工智能和機器學習的意義。CNN是一種能夠從
    發(fā)表于 10-24 13:56

    卷積神經網絡共包括哪些層級

    卷積神經網絡(Convolutional Neural Network, CNN)是一種深度學習模型,廣泛應用于圖像識別、語音識別、自然語言處理等領域。它以
    的頭像 發(fā)表于 07-11 15:58 ?2816次閱讀

    卷積神經網絡通常用來處理什么

    卷積神經網絡(Convolutional Neural Networks, CNNs)通常被用來處理具有顯著空間層次結構的數據,特別是圖像和視頻數據。它們通過模擬人類視覺
    的頭像 發(fā)表于 07-11 14:51 ?1540次閱讀

    卷積神經網絡的應用場景及優(yōu)缺點

    卷積神經網絡(Convolutional Neural Networks,簡稱CNNs)是一種深度學習架構,它在圖像識別、視頻分析、自然語言處理等領域有著廣泛的應用。 一、
    的頭像 發(fā)表于 07-11 14:45 ?1818次閱讀

    卷積神經網絡有何用途 卷積神經網絡通常運用在哪里

    卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理、生物信息學等領域。本文將介紹
    的頭像 發(fā)表于 07-11 14:43 ?4354次閱讀

    卷積神經網絡的基本概念、原理及特點

    卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是一種深度學習算法,它在圖像識別、視頻分析、自然語言處理等領域有著廣泛的應用。本文將詳細介紹
    的頭像 發(fā)表于 07-11 14:38 ?2441次閱讀

    神經網絡中的卷積層、池化層與全連接層

    在深度學習中,卷積神經網絡(Convolutional Neural Network, CNN)是一種特別適用于處理圖像數據的神經網絡結構。
    的頭像 發(fā)表于 07-11 14:18 ?9990次閱讀

    卷積神經網絡的工作原理和應用

    卷積神經網絡(FCN)是深度學習領域中的一種特殊類型的神經網絡結構,尤其在計算機視覺領域表現(xiàn)出色。它通過全局平均池化或轉置卷積處理任意尺寸
    的頭像 發(fā)表于 07-11 11:50 ?1852次閱讀

    卷積神經網絡的壓縮方法

    卷積神經網絡(Convolutional Neural Network, CNN)作為深度學習領域的重要分支,在圖像識別、視頻處理、自然語言處理
    的頭像 發(fā)表于 07-11 11:46 ?759次閱讀