一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

【連載】深度學(xué)習(xí)筆記10:三維卷積、池化與全連接

人工智能實(shí)訓(xùn)營(yíng) ? 2018-10-25 20:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


在上一講中,我們對(duì)卷積神經(jīng)網(wǎng)絡(luò)中的卷積操作進(jìn)行了詳細(xì)的解讀,但僅僅是對(duì)二維圖像,即通道數(shù)為 1 的圖像(灰度圖)進(jìn)行了卷積,對(duì)于三維或者更高維的圖像卷積顯然并沒有這么簡(jiǎn)單。

如果圖像大小為 6*6*3,那么這里的 3 指的是三個(gè)顏色通道,你可以將其理解為 3 個(gè) 6*6 的圖像的堆疊,如果要對(duì)此圖像進(jìn)行卷積的話,我們的濾波器也需要變成三維的,假設(shè)采用一個(gè) 3*3*3 的濾波器對(duì)其進(jìn)行卷積(這里需要注意的是,濾波器的通道數(shù)一定要等于輸入圖像的通道數(shù)),根據(jù) ((n+2p-f)/s)+1 的計(jì)算公式我們可以知道輸出圖像的大小為 4*4*1,由一個(gè)濾波器進(jìn)行卷積之后輸出圖像的通道不是 3 而是 1 了。


那么究竟如何理解三通道的卷積過程?單通道的卷積操作我們已經(jīng)知道,就是直接對(duì)感受野與濾波器進(jìn)行元素相乘求和,那三通道呢?我們可以將 3*3*3 的濾波器想象為一個(gè)三維的立方體,為了計(jì)算立方體濾波器在輸入圖像上的卷積操作,我們首先將這個(gè)三維的濾波器放到左上角,讓三維濾波器的 27 個(gè)數(shù)依次乘以紅綠藍(lán)三個(gè)通道中的像素?cái)?shù)據(jù),即濾波器的前 9 個(gè)數(shù)乘以紅色通道中的數(shù)據(jù),中間 9 個(gè)數(shù)乘以綠色通道中的數(shù)據(jù),最后 9 個(gè)數(shù)乘以藍(lán)色通道中的數(shù)據(jù)。將這些數(shù)據(jù)加總起來,就得到輸出像素的第一個(gè)元素值。如下圖所示:


這樣做可能還不夠。在實(shí)際圖像處理中,僅靠單濾波器很難將復(fù)雜的圖像特征進(jìn)行充分提取。所以,通常而言,我們用來進(jìn)行卷積的濾波器遠(yuǎn)不止一個(gè)。下面我們用兩個(gè)濾波器對(duì)上述圖像進(jìn)行卷積操作。


我們用第一個(gè)濾波器進(jìn)行卷積得到一個(gè) 4*4 的輸出,然后用第二個(gè)濾波器進(jìn)行卷積又得到一個(gè) 4*4 的輸出,將這個(gè)輸出放到第一個(gè)輸出后面,形成了一個(gè) 4*4*2 的輸出,這里的 2 的就是濾波器的個(gè)數(shù)。

關(guān)于多通道卷積的另一種理解類似于 DNN 中的標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)中的 Z=Wx+b 的線性計(jì)算,其中 x 為輸入的原始圖像,W 為濾波器,b 偏差項(xiàng),卷積過程就類似與標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)的線性計(jì)算,完了之后利用激活函數(shù)進(jìn)行激活。還有一個(gè)關(guān)鍵問題就是卷積層有多少參數(shù),卷積層的參數(shù)通常在于濾波器 W,根據(jù)濾波器的大小,我們可以計(jì)算一個(gè)濾波器的參數(shù)數(shù)量為 f*f*nc,其中 nc 為通道熟量,那 k 個(gè)濾波器所含的參數(shù)數(shù)量則為 f*f*nc*k

卷積過程到此就差不多解釋完了。我們?cè)倏?CNN 的另一個(gè)重要操作——池化(pooling)。簡(jiǎn)單來說,池化層是用來縮減模型大小,提高模型計(jì)算速度以及提高所提取特征的魯棒性。池化操作通常有兩種,一種是常用的最大池化(max pooling),另一種是不常用的平均池化(average pooling)。池化操作過程也非常簡(jiǎn)單,假設(shè)池化層的輸入為一個(gè) 4*4 的圖像,我們用最大池化對(duì)其進(jìn)行池化,執(zhí)行最大池化的樹池是一個(gè) 2*2 的矩陣,執(zhí)行過程就是將輸入矩陣拆分為不同區(qū)域,對(duì)于 2*2 的輸出而言,輸出的每個(gè)元素都是其對(duì)應(yīng)區(qū)域的最大元素值。


最大池化過程就像是應(yīng)用了一個(gè) 2*2 的濾波器以步幅 2 進(jìn)行區(qū)域最大化輸出操作。所以簡(jiǎn)單而言,池化的參數(shù)就是濾波器的大小 f 和步幅 s,池化的效果就相當(dāng)于對(duì)輸入圖像的高度和寬度進(jìn)行縮小。值得注意的是,最大池化只是計(jì)算神經(jīng)網(wǎng)絡(luò)某一層的靜態(tài)屬性,中間并沒有什么學(xué)習(xí)過程。

池化完成之后就是標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)中的全連接層了。全連接層我們?cè)?DNN 中有詳細(xì)介紹,這里就不再贅述。總之,一個(gè)典型的卷積層通常包括卷積層-池化層和全連接層。

下一講中,我們將一起嘗試如何利用 numpy 實(shí)現(xiàn)一個(gè)簡(jiǎn)單的典型的卷積神經(jīng)網(wǎng)絡(luò)。

本文由《自興動(dòng)腦人工智能》項(xiàng)目部 凱文 投稿。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    VirtualLab:光學(xué)系統(tǒng)的三維可視

    摘要 為了對(duì)光學(xué)系統(tǒng)的性質(zhì)有一個(gè)基本的了解,對(duì)其組件的可視和光傳播的提示是非常有幫助的。為此,VirtualLab Fusion提供了一個(gè)工具來顯示光學(xué)系統(tǒng)的三維視圖。這些工具可以進(jìn)一步用于檢查
    發(fā)表于 05-30 08:45

    CASAIM與榮耀達(dá)成三維數(shù)字檢測(cè)技術(shù)合作

    近期,CASAIM與榮耀終端股份有限公司就終端消費(fèi)電子產(chǎn)品的三維數(shù)字檢測(cè)展開深度合作,雙方合作的首個(gè)項(xiàng)目將聚焦手機(jī)中框制造環(huán)節(jié),借助三維數(shù)字
    的頭像 發(fā)表于 05-16 18:06 ?474次閱讀

    南方測(cè)繪推出實(shí)景三維中國整體解決方案

    新型基礎(chǔ)測(cè)繪與實(shí)景三維中國建設(shè)持續(xù)推進(jìn),南方測(cè)繪深度聚焦,基于自主研發(fā)的SmartGIS平臺(tái),打造以地理實(shí)體數(shù)據(jù)為核心的“生產(chǎn)、處理、質(zhì)檢、管理、可視化分析”實(shí)景三維系列產(chǎn)品,提供
    的頭像 發(fā)表于 03-26 16:44 ?661次閱讀

    casaim自動(dòng)三維激光掃描

    CASAIM自動(dòng)三維激光掃描技術(shù)通過非接觸式高精度數(shù)據(jù)采集與智能分析系統(tǒng),為工業(yè)檢測(cè)提供流程數(shù)字化解決方案。
    的頭像 發(fā)表于 02-27 10:32 ?377次閱讀

    三維測(cè)量軟件的使用技巧

    需要哪些功能,如點(diǎn)云處理、三維建模、數(shù)據(jù)分析等。 軟件兼容性 :確保軟件能夠與現(xiàn)有的硬件設(shè)備兼容,如三維掃描儀、CAD軟件等。 用戶界面 :選擇界面直觀、操作簡(jiǎn)便的軟件,以減少學(xué)習(xí)成本。 技術(shù)支持和社區(qū) :選擇有良好技術(shù)
    的頭像 發(fā)表于 12-30 15:05 ?832次閱讀

    南方智能SmartGIS Inspec實(shí)景三維質(zhì)檢軟件介紹

    新型基礎(chǔ)測(cè)繪與實(shí)景三維中國建設(shè)持續(xù)推進(jìn),南方測(cè)繪集團(tuán)旗下南方智能深度聚焦,基于自主研發(fā)的SmartGIS平臺(tái),打造以地理實(shí)體數(shù)據(jù)為核心的“生產(chǎn)、處理、質(zhì)檢、管理、可視化分析”實(shí)景三維系列軟件,提供
    的頭像 發(fā)表于 12-27 11:20 ?1365次閱讀

    三維掃描與建模的區(qū)別 三維掃描在工業(yè)中的應(yīng)用

    數(shù)據(jù)。這一過程是自動(dòng)的,能夠快速捕捉物體的三維信息。 三維建模 :則需要專業(yè)建模師使用三維建模軟件,從無到有地創(chuàng)建三維模型。建模師可以根據(jù)
    的頭像 發(fā)表于 12-19 14:55 ?1112次閱讀

    南方智能推出三維地理實(shí)體生產(chǎn)軟件

    新型基礎(chǔ)測(cè)繪與實(shí)景三維中國建設(shè)持續(xù)推進(jìn),南方智能深度聚焦,基于自主研發(fā)的SmartGIS平臺(tái),打造以地理實(shí)體數(shù)據(jù)為核心的“生產(chǎn)、處理、質(zhì)檢、管理、可視化分析”實(shí)景三維系列軟件,提供
    的頭像 發(fā)表于 11-06 10:26 ?965次閱讀

    基于深度學(xué)習(xí)三維點(diǎn)云分類方法

    近年來,點(diǎn)云表示已成為計(jì)算機(jī)視覺領(lǐng)域的研究熱點(diǎn)之一,并廣泛應(yīng)用于自動(dòng)駕駛、虛擬現(xiàn)實(shí)、機(jī)器人等許多領(lǐng)域。雖然深度學(xué)習(xí)技術(shù)在處理常規(guī)結(jié)構(gòu)的二網(wǎng)格圖像數(shù)據(jù)方面取得了巨大成功,但在處理不規(guī)
    的頭像 發(fā)表于 10-29 09:43 ?1584次閱讀
    基于<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>的<b class='flag-5'>三維</b>點(diǎn)云分類方法

    關(guān)于卷積神經(jīng)網(wǎng)絡(luò),這些概念你厘清了么~

    。例如,最大值會(huì)選取窗口中的最大數(shù)據(jù)值而丟棄其它所有的值。這樣,數(shù)據(jù)量不斷減少,最終形成各個(gè)對(duì)象類別的唯一屬性。 卷積的結(jié)果是大量
    發(fā)表于 10-24 13:56

    三維觸摸面板-運(yùn)用觸感功能

    可以根據(jù)乘客的習(xí)慣和需求進(jìn)行個(gè)性的設(shè)置。 方向盤控制 :在方向盤上集成三維觸摸面板,駕駛員可以通過觸摸和按壓來控制車輛的巡航、多媒體、電話等功能,無需將手離開方向盤,進(jìn)一步提高了駕駛的便利性和安全性
    發(fā)表于 09-18 13:55

    三維可視建筑建模特點(diǎn)

    三維可視建筑建模是一種利用計(jì)算機(jī)技術(shù)對(duì)建筑物進(jìn)行立體表達(dá)和展示的過程,是建筑設(shè)計(jì)和規(guī)劃中不可或缺的重要環(huán)節(jié)。在當(dāng)今數(shù)字化時(shí)代,三維可視
    的頭像 發(fā)表于 07-23 11:50 ?871次閱讀

    如何實(shí)現(xiàn)三維地圖可視交互系統(tǒng)

    三維地圖可視 交互系統(tǒng)是一種基于三維地圖技術(shù)的交互式應(yīng)用程序,可以呈現(xiàn)地理信息和空間數(shù)據(jù)的立體展示,并提供用戶友好的交互功能。以下是古河云科技關(guān)于
    的頭像 發(fā)表于 07-19 18:20 ?2177次閱讀

    三維可視運(yùn)用的主要技術(shù)

    三維可視技術(shù)是一種強(qiáng)大的工具,可用于呈現(xiàn)復(fù)雜的數(shù)據(jù)和概念,使人們能夠更直觀地理解信息。在當(dāng)今數(shù)字化時(shí)代,三維可視已經(jīng)成為許多領(lǐng)域中不可或缺的技術(shù),包括工程、醫(yī)學(xué)、地理信息系統(tǒng)、游戲
    的頭像 發(fā)表于 07-19 13:56 ?641次閱讀

    泰來三維 三維激光掃描結(jié)合BIM在工廠掃描建模中的優(yōu)勢(shì)

    BIM技術(shù)是建設(shè)項(xiàng)目實(shí)施前的建筑信息模型搭建,三維激光掃描技術(shù)則是現(xiàn)實(shí)物體的三維信息數(shù)字。BIM具有可視、協(xié)調(diào)性、優(yōu)化性、模擬性和可視圖形的特點(diǎn),而
    的頭像 發(fā)表于 07-19 10:39 ?753次閱讀