一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SiamFC:用于目標(biāo)跟蹤的全卷積孿生網(wǎng)絡(luò) fully-convolutional siamese networks for object tracking

jf_96884364 ? 來源:代碼的路 ? 作者:代碼的路 ? 2023-01-11 17:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

原文鏈接

SiamFC網(wǎng)絡(luò)

<

圖中z代表的是模板圖像,算法中使用的是第一幀的ground truth;x代表的是search region,代表在后面的待跟蹤幀中的候選框搜索區(qū)域;?代表的是一種特征映射操作,將原始圖像映射到特定的特征空間,文中采用的是CNN中的卷積層和pooling層;6×6×128代表z經(jīng)過?后得到的特征,是一個128通道6×6大小feature,同理,22×22×128是x經(jīng)過?后的特征;后面的×代表卷積操作,讓22×22×128的feature被6×6×128的卷積核卷積,得到一個17×17的score map,代表著搜索區(qū)域中各個位置與模板相似度值。

算法本身是比較搜索區(qū)域與目標(biāo)模板的相似度,最后得到搜索區(qū)域的score map。其實從原理上來說,這種方法和相關(guān)性濾波的方法很相似。其在搜索區(qū)域中逐點的目標(biāo)模板進(jìn)行匹配,將這種逐點平移匹配計算相似度的方法看成是一種卷積,然后在卷積結(jié)果中找到相似度值最大的點,作為新的目標(biāo)的中心。

上圖所畫的?其實是CNN中的一部分,并且兩個?的網(wǎng)絡(luò)結(jié)構(gòu)是一樣的,這是一種典型的孿生神經(jīng)網(wǎng)絡(luò),并且在整個模型中只有conv層和pooling層,因此這也是一種典型的全卷積(fully-convolutional)神經(jīng)網(wǎng)絡(luò)。

在訓(xùn)練模型的時肯定需要損失函數(shù),并通過最小化損失函數(shù)來獲取最優(yōu)模型。本文算法為了構(gòu)造有效的損失函數(shù),對搜索區(qū)域的位置點進(jìn)行了正負(fù)樣本的區(qū)分,即目標(biāo)一定范圍內(nèi)的點作為正樣本,這個范圍外的點作為負(fù)樣本,例如圖1中最右側(cè)生成的score map中,紅色點即正樣本,藍(lán)色點為負(fù)樣本,他們都對應(yīng)于search region中的紅色矩形區(qū)域和藍(lán)色矩形區(qū)域。文章采用的是logistic loss,具體的損失函數(shù)形式如下:

對于score map中了每個點的損失:

l(y,x)=log(1+exp(-xy))

其中v是score map中每個點真實值,y∈{+1,?1}是這個點所對應(yīng)的標(biāo)簽

上面的是score map中每個點的loss值,而對于score map整體的loss,則采用的是全部點的loss的均值。即:

L(y,v)=\\frac{1}{|D|}\\displaystyle \\sum_{u\\in D}l(y[u],v[u])

這里的u∈D代表score map中的位置。

整個網(wǎng)絡(luò)結(jié)構(gòu)類似與AlexNet,但是沒有最后的全連接層,只有前面的卷積層和pooling層。

整個網(wǎng)絡(luò)結(jié)構(gòu)如上表,其中pooling層采用的是max-pooling,每個卷積層后面都有一個ReLU非線性激活層,但是第五層沒有。另外,在訓(xùn)練的時候,每個ReLU層前都使用了batch normalization(批規(guī)范化是深度學(xué)習(xí)中經(jīng)常見到的一種訓(xùn)練方法,指在采用梯度下降法訓(xùn)練DNN時,對網(wǎng)絡(luò)層中每個mini-batch的數(shù)據(jù)進(jìn)行歸一化,使其均值變?yōu)?,方差變?yōu)?,其主要作用是緩解DNN訓(xùn)練中的梯度消失/爆炸現(xiàn)象,加快模型的訓(xùn)練速度),用于降低過擬合的風(fēng)險。

AlexNet

AlexNet為8層結(jié)構(gòu),其中前5層為卷積層,后面3層為全連接層;學(xué)習(xí)參數(shù)有6千萬個,神經(jīng)元有650,000個。AlexNet在兩個GPU上運行;AlexNet在第2,4,5層均是前一層自己GPU內(nèi)連接,第3層是與前面兩層全連接,全連接是2個GPU全連接;

RPN層第1,2個卷積層后;Max pooling層在RPN層以及第5個卷積層后。ReLU在每個卷積層以及全連接層后。

卷積核大小數(shù)量:

  • conv1:96 11×11×3(個數(shù)/長/寬/深度)
  • conv2:256 5×5×48
  • conv3:384 3×3×256
  • conv4: 384 3×3×192
  • conv5: 256 3×3×192

ReLU、雙GPU運算:提高訓(xùn)練速度。(應(yīng)用于所有卷積層和全連接層)

重疊pool池化層:提高精度,不容易產(chǎn)生過度擬合。(應(yīng)用在第一層,第二層,第五層后面)

局部響應(yīng)歸一化層(LRN):提高精度。(應(yīng)用在第一層和第二層后面)

Dropout:減少過度擬合。(應(yīng)用在前兩個全連接層)

微調(diào)(fine-tune)

看到別人一個很好的模型,雖然針對的具體問題不一樣,但是也想試試看,看能不能得到很好的效果,而且自己的數(shù)據(jù)也不多,怎么辦?沒關(guān)系,把別人現(xiàn)成的訓(xùn)練好了的模型拿過來,換成自己的數(shù)據(jù),調(diào)整一下參數(shù),再訓(xùn)練一遍,這就是微調(diào)(fine-tune)。

凍結(jié)預(yù)訓(xùn)練模型的部分卷積層(通常是靠近輸入的多數(shù)卷積層),訓(xùn)練剩下的卷積層(通常是靠近輸出的部分卷積層)和全連接層。從某意義上來說,微調(diào)應(yīng)該是遷移學(xué)習(xí)中的一部分。

感知機:PLA

多層感知機是由感知機推廣而來,感知機學(xué)習(xí)算法(PLA: Perceptron Learning Algorithm)用神經(jīng)元的結(jié)構(gòu)進(jìn)行描述的話就是一個單獨的。

感知機的神經(jīng)網(wǎng)絡(luò)表示如下:

多層感知機:MLP

多層感知機的一個重要特點就是多層,我們將第一層稱之為輸入層,最后一層稱之為輸出層,中間的層稱之為隱層。MLP并沒有規(guī)定隱層的數(shù)量,因此可以根據(jù)各自的需求選擇合適的隱層層數(shù)。且對于輸出層神經(jīng)元的個數(shù)也沒有限制。

MLP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型如下,本文中只涉及了一個隱層,輸入只有三個變量[x1,x2,x3]和一個偏置量b,輸出層有三個神經(jīng)元。相比于感知機算法中的神經(jīng)元模型對其進(jìn)行了集成。

ReLU函數(shù)

ReLU函數(shù)公式如下:

RELU(x)= \\begin{cases} x, & \\text {if x>0} \\ 0, & \\text{if x<0} \\end{cases}

圖像如下:

sigmod函數(shù)

sigmod 函數(shù)在趨于正無窮或負(fù)無窮時,函數(shù)趨近平滑狀態(tài)。因為輸出范圍(0,1),所以二分類的概率常常用這個函數(shù)。

sigmoid函數(shù)表達(dá)式如下 :

f(x)=\\frac{1}{(1-e^{-z})}

圖像如下:

學(xué)習(xí)更多編程知識,請關(guān)注我的公眾號:

[代碼的路]

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1329

    瀏覽量

    58056
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4381

    瀏覽量

    64882
  • PLA
    PLA
    +關(guān)注

    關(guān)注

    0

    文章

    41

    瀏覽量

    17390
  • 全卷積網(wǎng)絡(luò)

    關(guān)注

    0

    文章

    7

    瀏覽量

    2129
  • MLP
    MLP
    +關(guān)注

    關(guān)注

    0

    文章

    57

    瀏覽量

    4618
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    計算機視覺必讀:區(qū)分目標(biāo)跟蹤、網(wǎng)絡(luò)壓縮、圖像分類、人臉識別

    的訓(xùn)練數(shù)據(jù)集通常和要用于檢索的數(shù)據(jù)集比較相似。此外,可以用候選區(qū)域網(wǎng)絡(luò)提取圖像中可能包含目標(biāo)的前景區(qū)域。孿生網(wǎng)絡(luò)(
    發(fā)表于 06-08 08:00

    Large-Scale_FPGA-based_Convolutional_Networks

    Large-Scale FPGA-based Convolutional Networks
    發(fā)表于 03-24 17:00 ?0次下載

    卷積網(wǎng)絡(luò)FCN進(jìn)行圖像分割

    Networks for Semantic Segmentation》在圖像語義分割挖了一個坑,于是無窮無盡的人往坑里面跳。 卷積網(wǎng)絡(luò) Full
    發(fā)表于 09-26 17:22 ?776次閱讀

    基于信息熵的級聯(lián)Siamese網(wǎng)絡(luò)目標(biāo)跟蹤方法

    目標(biāo)跟蹤是計算機視覺領(lǐng)域的一個重要研究方向,針對目前算法對于目標(biāo)外觀變化的魯棒性較差等問題,提出了一種基于信息熵的級聯(lián) Siamese網(wǎng)絡(luò)
    發(fā)表于 05-07 14:11 ?1次下載

    SiamRPN:High Performance Visual Tracking with Siamese Region Proposal Network 孿生網(wǎng)絡(luò)

    /Li_High_Performance_Visual_CVPR_2018_paper.pdf 摘要 大多數(shù)性能優(yōu)越的視覺目標(biāo)跟蹤器很難有實時速度。在這篇文章中,我們提出了孿生候選區(qū)域生成網(wǎng)絡(luò)
    的頭像 發(fā)表于 01-11 17:41 ?1428次閱讀
    SiamRPN:High Performance Visual <b class='flag-5'>Tracking</b> with <b class='flag-5'>Siamese</b> Region Proposal Network <b class='flag-5'>孿生</b><b class='flag-5'>網(wǎng)絡(luò)</b>

    SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks 深層網(wǎng)絡(luò)連體視覺跟蹤的演變

    /SiamRPN_plus_plus_PyTorch 摘要 基于孿生網(wǎng)絡(luò)跟蹤器將跟蹤表述為目標(biāo)模板和搜索區(qū)域之間的
    的頭像 發(fā)表于 01-11 17:52 ?1451次閱讀
    SiamRPN++: Evolution of <b class='flag-5'>Siamese</b> Visual <b class='flag-5'>Tracking</b> with Very Deep <b class='flag-5'>Networks</b>  深層<b class='flag-5'>網(wǎng)絡(luò)</b>連體視覺<b class='flag-5'>跟蹤</b>的演變

    SA-Siam:用于實時目標(biāo)跟蹤孿生網(wǎng)絡(luò)A Twofold Siamese Network for Real-Time Object Tracking

    目標(biāo)跟蹤任務(wù),因此本文方法可以簡單概括為:SA-Siam=語義分支+外觀分支; 2.Motivation:目標(biāo)跟蹤的特點是,我們想從眾多背景中區(qū)分出變化的
    的頭像 發(fā)表于 01-11 17:54 ?1404次閱讀
    SA-Siam:<b class='flag-5'>用于</b>實時<b class='flag-5'>目標(biāo)</b><b class='flag-5'>跟蹤</b>的<b class='flag-5'>孿生</b><b class='flag-5'>網(wǎng)絡(luò)</b>A Twofold <b class='flag-5'>Siamese</b> Network for Real-Time <b class='flag-5'>Object</b> <b class='flag-5'>Tracking</b>

    DW-Siam:Deeper and Wider Siamese Networks for Real-Time Visual Tracking 更寬更深的孿生網(wǎng)絡(luò)

    原文鏈接 論文地址:https://arxiv.org/pdf/1901.01660.pdf 摘要 目前在孿生網(wǎng)絡(luò)追蹤器中使用的主干網(wǎng)絡(luò)相對較淺,例AlexNet。本文研究如何利用更深和更廣的
    的頭像 發(fā)表于 01-12 09:24 ?1160次閱讀
    DW-Siam:Deeper and Wider <b class='flag-5'>Siamese</b> <b class='flag-5'>Networks</b> for Real-Time Visual <b class='flag-5'>Tracking</b> 更寬更深的<b class='flag-5'>孿生</b><b class='flag-5'>網(wǎng)絡(luò)</b>

    卷積神經(jīng)網(wǎng)絡(luò)詳解 卷積神經(jīng)網(wǎng)絡(luò)包括哪幾層及各層功能

    卷積神經(jīng)網(wǎng)絡(luò)詳解 卷積神經(jīng)網(wǎng)絡(luò)包括哪幾層及各層功能 卷積神經(jīng)網(wǎng)絡(luò)(
    的頭像 發(fā)表于 08-21 16:41 ?7006次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本原理 卷積神經(jīng)網(wǎng)絡(luò)發(fā)展 卷積神經(jīng)網(wǎng)絡(luò)三大特點

    卷積神經(jīng)網(wǎng)絡(luò)的基本原理 卷積神經(jīng)網(wǎng)絡(luò)發(fā)展歷程 卷積神經(jīng)網(wǎng)絡(luò)三大特點?
    的頭像 發(fā)表于 08-21 16:49 ?3137次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)算法代碼matlab

    )、池化層(Pooling Layer)和連接層(Fully Connected Layer)。卷積神經(jīng)網(wǎng)絡(luò)源自對腦神經(jīng)細(xì)胞的研究,能夠有效地處理大規(guī)模的視覺和語音數(shù)據(jù)。本文將詳細(xì)介
    的頭像 發(fā)表于 08-21 16:50 ?1528次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)可以通過輸出反推到輸入嗎

    卷積神經(jīng)網(wǎng)絡(luò)Convolutional Neural Networks,簡稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、視頻分析、自然
    的頭像 發(fā)表于 07-03 09:17 ?1191次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的組成部分有哪些

    卷積神經(jīng)網(wǎng)絡(luò)Convolutional Neural Networks, CNNs)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、視頻分析、自然
    的頭像 發(fā)表于 07-03 09:31 ?2029次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)分類方法有哪些

    卷積神經(jīng)網(wǎng)絡(luò)Convolutional Neural Networks,CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像分類、
    的頭像 發(fā)表于 07-03 09:40 ?1048次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本原理與算法

    卷積神經(jīng)網(wǎng)絡(luò)Convolutional Neural Networks,CNN)是一類包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)
    的頭像 發(fā)表于 11-15 14:47 ?1782次閱讀