一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

解析yolov7采用的一項技術(shù):模型結(jié)構(gòu)重參化

博世蘇州 ? 來源:博世蘇州 ? 作者:博世蘇州 ? 2022-08-09 14:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Yolov7問世,刷新了目標(biāo)檢測內(nèi)卷的新上限!小博此次攜手博世AI大神Zlex做一次解析。今天,我們不準(zhǔn)備解析yolov7,而是解析yolov7采用的一項技術(shù):模型結(jié)構(gòu)重參化。

首先,這要從古老的vgg說起,很久很久以前神經(jīng)網(wǎng)絡(luò)還沒有很多花樣的時候,他是一個以卷積為主串聯(lián)的網(wǎng)絡(luò)結(jié)構(gòu),如下圖所示:

3a51761a-179c-11ed-ba43-dac502259ad0.png

3a5ec388-179c-11ed-ba43-dac502259ad0.png

由于見證了神經(jīng)網(wǎng)絡(luò)的神奇效果,科學(xué)家工程師們前仆后繼開發(fā)了resnet, inception net, 以及自學(xué)習(xí)產(chǎn)生的efficientnet等等以結(jié)構(gòu)創(chuàng)新為主的系列,以及歸一化系列(ln,bn,gn,in),激活函數(shù)系列, 卷積系列等各種新的計算層,還有各種損失函數(shù)層等等。

隨著思維的展開,除了從計算方法(數(shù)學(xué)推理角度)和網(wǎng)絡(luò)結(jié)構(gòu)(實驗性創(chuàng)新角度)層面創(chuàng)新,還有哪些腦洞可以打開呢?是否可以實現(xiàn)數(shù)學(xué)和網(wǎng)絡(luò)結(jié)構(gòu)方面的互相轉(zhuǎn)化?答案是肯定的,數(shù)學(xué)推算和結(jié)構(gòu)設(shè)計之間是可以相互轉(zhuǎn)化的。

而模型結(jié)構(gòu)重參化就是其中一種。

01

模型結(jié)構(gòu)重參化

模型結(jié)構(gòu)重參化是繼承了深度學(xué)習(xí)的特性,并作為思考點而展開的,也就是訓(xùn)練(train)和推斷(deploy)分別思考的策略,通常我們是可以忍受訓(xùn)練速度較慢,但是推理更加快速的部署方案。

基于這個現(xiàn)實的考慮,是否可能通過增加訓(xùn)練的復(fù)雜度但不增加推斷運行的時間,從而達(dá)到模型能力的提升?

其實這一切都經(jīng)不起科學(xué)家的推敲,這種思路的可行性答案也是肯定的,其實在很久之前的部署加速技巧—— Conv、BN、Relu 三個層融合(大部分情況是conv和bn融合)也是發(fā)現(xiàn)了——訓(xùn)練和部署可以在網(wǎng)絡(luò)結(jié)構(gòu)不同的情況下實現(xiàn)效果等價,這個數(shù)學(xué)公式等價變換思路。而tensorRT等部署加速方案也都融合了這項技術(shù)。

模型結(jié)構(gòu)重參化(structural re-parameterization)是丁霄漢近年來提出的一種通用深度學(xué)習(xí)模型設(shè)計方法論。該方法論首先指出了構(gòu)造一系列用于訓(xùn)練的結(jié)構(gòu),并將其結(jié)構(gòu)等價轉(zhuǎn)換為另一種用于測試的結(jié)構(gòu),也就是訓(xùn)練和測試的結(jié)構(gòu)不再相同,但是效果等效。

該理論是假設(shè)在訓(xùn)練資源相對豐富的條件下,在不降低推理能力的前提下又能達(dá)到提速的目的。因此訓(xùn)練時的模型可以足夠復(fù)雜,且具備優(yōu)秀的性質(zhì)。而轉(zhuǎn)換得到的推理時模型可以簡化,但能力不會減弱,也就是實現(xiàn)無損壓縮。

為什么要以vgg為例,而不是以目前各種先進(jìn)復(fù)雜的結(jié)構(gòu)為例解析這一設(shè)計呢?其原因在于:模型結(jié)構(gòu)復(fù)雜提升了精度,但不利于硬件的各種并行加速計算。但vgg這種單一的結(jié)構(gòu)更容易做很多的變形和加速操作,Repvgg就是基于vgg網(wǎng)絡(luò)的模型結(jié)構(gòu)重參化。

論文中對比了resnet的參差結(jié)構(gòu)和rep結(jié)構(gòu)的不同,以及訓(xùn)練和推理網(wǎng)絡(luò)如何轉(zhuǎn)化,如下圖所示:

3a80dd74-179c-11ed-ba43-dac502259ad0.png

以上設(shè)計方法論基于的數(shù)學(xué)關(guān)系是:

(i+c+b)*w=i*w + c*w + b*w的等式理論。

該等式畫成結(jié)構(gòu)圖是:

3a988cda-179c-11ed-ba43-dac502259ad0.png

只不過在卷積的世界里,a和b表示的是一個n*n的核;而在一些設(shè)計里面,a和b的大小是不一致的。這個時候就需要把現(xiàn)在a和b的維度進(jìn)行一致性轉(zhuǎn)換,也就是repvgg作者采用的:把1*1的核通過pad的方法補(bǔ)0操作變成3*3的核,達(dá)到a、b維度一致。

identity的操作相當(dāng)于是1*1的單位矩陣卷積pad后就可以轉(zhuǎn)化為3*3的卷積核。還應(yīng)該值得注意的是:每個卷積后面還跟著bn層,這是就用到了上述提到的conv和bn的融合計算方法。

02

Yolov7在這項技術(shù)上的發(fā)現(xiàn)和創(chuàng)新

Yolov7中的模型結(jié)構(gòu)重參化做了哪些創(chuàng)新?

Zlex發(fā)現(xiàn)Rep的結(jié)構(gòu)策略直接用到resnet等結(jié)構(gòu)的網(wǎng)絡(luò)中達(dá)不到預(yù)期效果,分析后發(fā)現(xiàn)identity層的使用破壞了resnet的參差結(jié)構(gòu)和densenet的級聯(lián)結(jié)構(gòu),因此去掉identity層,采用如下圖(g和h)的結(jié)構(gòu)方式有效。

3aa93ab2-179c-11ed-ba43-dac502259ad0.png

03

Yolov7工業(yè)應(yīng)用領(lǐng)域的改善空間

俗話說,極致的項目一般是“既要,也要,還要”的模式——既要推理速度快!也要推理精度高!還要訓(xùn)練速度也不能太慢!

Yolov7無疑是吸收了很多仙氣修煉成的佳作,但也存在些許缺點,這些缺點也是該設(shè)計本質(zhì)性的東西,Yolov7的訓(xùn)練速度經(jīng)過Zlex親測,比其他yolo系列慢了很多。對于資源有限型的AI愛好者也形成了一定的障礙,單元時間可以跑的實驗次數(shù)少了很多,驗證一些想法的節(jié)奏也慢了很多。

Yolov7給博世工業(yè)檢測、自動駕駛、數(shù)字化等領(lǐng)域又注入了新的超能力,應(yīng)用過程中也會發(fā)現(xiàn)這樣或者那樣的問題,比方說訓(xùn)練資源有限,速度跟不上項目的節(jié)奏,能力提升的trick不夠適應(yīng)自己的應(yīng)用場景,小數(shù)據(jù)訓(xùn)練效果不佳,不同平臺的移植工作量大等等,需要我們博世工程師在適配、融合和改進(jìn)的路上堅定的前進(jìn)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3516

    瀏覽量

    50363
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5560

    瀏覽量

    122764

原文標(biāo)題:博采眾長 | 在提升深度學(xué)習(xí)模型能力方面的那些魔鬼細(xì)節(jié):模型結(jié)構(gòu)重參化

文章出處:【微信號:rbacinternalevents,微信公眾號:博世蘇州】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    如何提高yolov8模型在k230上運行的幀率?

    ,display_mode=display_mode)pl.create()# 初始YOLOv8實例yolo=YOLOv8(task_type=\"detect\",mode
    發(fā)表于 06-20 06:25

    請問如何在imx8mplus上部署和運行YOLOv5訓(xùn)練的模型?

    我正在從事 imx8mplus yocto 項目。我已經(jīng)在自定義數(shù)據(jù)集上的 YOLOv5 上訓(xùn)練了對象檢測模型。它在 ubuntu 電腦上運行良好。現(xiàn)在我想在我的 imx8mplus 板上運行該模型
    發(fā)表于 03-25 07:23

    YOLOv5類中rgb888p_size這個參數(shù)要與模型推理和訓(xùn)練的尺寸致嗎?致會達(dá)到更好的效果?

    YOLOv5類中rgb888p_size這個參數(shù)要與模型推理和訓(xùn)練的尺寸致嗎,致會達(dá)到更好的效果
    發(fā)表于 03-11 08:12

    YOLOv4模型轉(zhuǎn)換為IR的說明,無法將模型轉(zhuǎn)換為TensorFlow2格式怎么解決?

    遵照 將 YOLOv4 模型轉(zhuǎn)換為 IR 的 說明,但無法將模型轉(zhuǎn)換為 TensorFlow2* 格式。 將 YOLOv4 darknet 轉(zhuǎn)換為 Keras
    發(fā)表于 03-07 07:14

    OpenVINO?工具套件插件對YOLOv5s模型和scatterUpate層的支持范圍是什么?

    OpenVINO?工具套件插件對YOLOv5s模型和scatterUpate層的支持范圍是什么?
    發(fā)表于 03-05 10:16

    【ELF 2學(xué)習(xí)板試用】ELF2開發(fā)板(飛凌嵌入式)部署yolov5s的自定義模型

    開發(fā)板上進(jìn)行推理。 獲得自定義訓(xùn)練得到的yolov5s pt模型 準(zhǔn)備自定義數(shù)據(jù)集(博主用的是VOC數(shù)據(jù)集) 數(shù)據(jù)集目錄結(jié)構(gòu)如下: └─VOC2028:自定義數(shù)據(jù)集 ├─Annotations存放
    發(fā)表于 02-04 18:15

    【「基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化」閱讀體驗】+大模型微調(diào)技術(shù)解讀

    今天學(xué)習(xí)<基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化>這本書。大模型微調(diào)是深度學(xué)習(xí)領(lǐng)域中的一項關(guān)鍵技術(shù),它指的是在已經(jīng)預(yù)訓(xùn)練好的大型深度學(xué)習(xí)模型
    發(fā)表于 01-14 16:51

    ? SLA立體光固化成型:一項實現(xiàn)3D打印領(lǐng)域高精度數(shù)字模型實體的先鋒技術(shù)

    發(fā)明。自創(chuàng)造以來,便以優(yōu)異的快速成型特征和高精度表現(xiàn),成為了一項實現(xiàn)復(fù)雜數(shù)字模型實體的關(guān)鍵技術(shù)。它不僅突破了制造業(yè)的傳統(tǒng)模具模式,還能在加速將設(shè)計概念轉(zhuǎn)變成實際產(chǎn)品的同時,保持產(chǎn)品表
    發(fā)表于 01-09 18:57

    采用華為云 Flexus 云服務(wù)器 X 實例部署 YOLOv3 算法完成目標(biāo)檢測

    、前言 1.1 開發(fā)需求 這篇文章講解:?采用華為云最新推出的 Flexus 云服務(wù)器 X 實例部署 YOLOv3 算法,完成圖像分析、目標(biāo)檢測。 隨著計算機(jī)視覺技術(shù)的飛速發(fā)展,深度
    的頭像 發(fā)表于 01-02 12:00 ?538次閱讀
    <b class='flag-5'>采用</b>華為云 Flexus 云服務(wù)器 X 實例部署 <b class='flag-5'>YOLOv</b>3 算法完成目標(biāo)檢測

    AMD獲得一項玻璃基板技術(shù)專利

    近日,處理器大廠AMD宣布獲得了一項涵蓋玻璃芯基板技術(shù)的專利(專利號“12080632”),這消息標(biāo)志著AMD在高性能系統(tǒng)級封裝(SiP)領(lǐng)域的研究取得了重要進(jìn)展。
    的頭像 發(fā)表于 12-02 10:33 ?514次閱讀

    YOLOv8中的損失函數(shù)解析

    YOLO長期以來直是目標(biāo)檢測任務(wù)的首選模型。它既快速又準(zhǔn)確。此外,其API簡潔易用。運行訓(xùn)練或推斷作業(yè)所需的代碼行數(shù)有限。在2023年下半年,YOLOv8在框架中引入了姿態(tài)估計后
    的頭像 發(fā)表于 11-05 17:15 ?3876次閱讀
    <b class='flag-5'>YOLOv</b>8中的損失函數(shù)<b class='flag-5'>解析</b>

    手冊上新 |迅為RK3568開發(fā)板NPU例程測試

    yolov5目標(biāo)檢測 6.13 yolov5-seg語義分割 6.14 yolov6目標(biāo)檢測 6.15 yolov7目標(biāo)檢測 6.16 yolov
    發(fā)表于 10-23 14:06

    中國電信人工智能研究院完成首個全國產(chǎn)萬卡萬模型訓(xùn)練

    近日,中國電信人工智能研究院宣布了一項重大技術(shù)突破:成功完成國內(nèi)首個基于全國產(chǎn)萬卡集群訓(xùn)練的萬億參數(shù)大模型
    的頭像 發(fā)表于 09-30 16:41 ?2039次閱讀

    基于迅為RK3588【RKNPU2目實戰(zhàn)1】:YOLOV5實時目標(biāo)分類

    【RKNPU2目實戰(zhàn)1】:YOLOV5實時目標(biāo)分類 https://www.bilibili.com/video/BV1ZN411D7V8/?spm_id_from=333.999.0.0
    發(fā)表于 08-15 10:51

    手冊上新 |迅為RK3568開發(fā)板NPU例程測試

    yolov5目標(biāo)檢測 6.13 yolov5-seg語義分割 6.14 yolov6目標(biāo)檢測 6.15 yolov7目標(biāo)檢測 6.16 yolov
    發(fā)表于 08-12 11:03