一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

COCO單模型測(cè)試取得新紀(jì)錄:60.6 AP

新機(jī)器視覺 ? 來源:新智元 ? 作者:袁路 ? 2021-06-23 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著注意力機(jī)制在自然語言處理和計(jì)算機(jī)視覺等多個(gè)人工智能領(lǐng)域風(fēng)靡,計(jì)算機(jī)視覺領(lǐng)域刷榜之爭(zhēng)可謂是進(jìn)入白熱化階段。

近期大量工作刷新現(xiàn)有各項(xiàng)任務(wù)SOTA:前腳谷歌剛在圖像識(shí)別ImageNet上準(zhǔn)確度超過90,緊接著微軟又在目標(biāo)檢測(cè)COCO上AP超過60。

在一篇CVPR 2021 論文中,來自微軟的研究者提出多重注意力機(jī)制統(tǒng)一目標(biāo)檢測(cè)頭方法Dynamic Head, 可插拔特性提高多種目標(biāo)檢測(cè)框架的性能。

在Transformer骨干和額外數(shù)據(jù)加持下,COCO單模型測(cè)試取得新紀(jì)錄:60.6 AP。

方法概述

本文首先對(duì)現(xiàn)有目標(biāo)檢測(cè)頭的改進(jìn)工作進(jìn)行了總結(jié),發(fā)現(xiàn)近期方法主要通過三個(gè)不同的角度出發(fā)進(jìn)行目標(biāo)檢測(cè)性能的提升:

尺度感知:目標(biāo)尺度的差異對(duì)應(yīng)了不同尺度的特征,改進(jìn)不同級(jí)的表達(dá)能力可以有效提升目標(biāo)檢測(cè)器的尺度感知能力;

空間位置:不相似目標(biāo)形狀的不同幾何變換對(duì)應(yīng)了特征的不同空間位置,改進(jìn)不同空間位置的表達(dá)能力可以有效提升目標(biāo)檢測(cè)器的空間位置感知能力;

多任務(wù):目標(biāo)表達(dá)與任務(wù)的多樣性對(duì)應(yīng)了不同通道特征,改進(jìn)不同通道的表達(dá)能力可以有效提升目標(biāo)檢測(cè)的任務(wù)感知能力。

本文提出一種新穎的動(dòng)態(tài)頭框架,它采用多注意力機(jī)制將不同的目標(biāo)檢測(cè)頭進(jìn)行統(tǒng)一。

通過特征層次之間的注意力機(jī)制用于尺度感知,空間位置之間的注意力機(jī)制用于空間感知,輸出通道內(nèi)的注意力機(jī)制用于任務(wù)感知,該方法可以在不增加計(jì)算量的情況顯著提升模型目標(biāo)檢測(cè)頭的表達(dá)能力。

為了達(dá)成以上目的,本文對(duì)特征金字塔進(jìn)行重構(gòu),將不同層級(jí)的特征統(tǒng)一到一個(gè)3D張量,并發(fā)現(xiàn)在不同維度引入注意力機(jī)制可以提高對(duì)尺度,空間位置和多任務(wù)的感知能力。

因此上述方向可以統(tǒng)一到一個(gè)高效注意力學(xué)習(xí)問題中。本文也是首個(gè)嘗試采用多注意力機(jī)制將三個(gè)維度組合構(gòu)建統(tǒng)一頭并最大化其性能的工作。

作者將注意力函數(shù)轉(zhuǎn)換為三個(gè)序列子注意力函數(shù)來解決傳統(tǒng)注意力函數(shù)在高維度導(dǎo)致計(jì)算量激增的問題。

每個(gè)注意力函數(shù)僅聚焦一個(gè)維度:基于SE模塊的尺度自注意函數(shù)π_L, 基于可變形卷積的空間自注意函數(shù)π_S 和 基于動(dòng)態(tài)ReLU激活函數(shù)的多任務(wù)的自注意函數(shù)π_C。

作者將三種自注意函數(shù)進(jìn)行堆疊,形成一個(gè)可輕易插拔的模塊DyHead,并將其應(yīng)用于多種目標(biāo)檢測(cè)框架中。

實(shí)驗(yàn)結(jié)果

作者首先分析了的計(jì)算效率。當(dāng)采用6個(gè)模塊時(shí),模型性能提升達(dá)到最大,而計(jì)算量提升相比骨干網(wǎng)絡(luò)可以忽略。

作者將DyHead集成到不同檢測(cè)器進(jìn)行性能對(duì)比,發(fā)現(xiàn)所提DyHead可以一致性提升所有主流目標(biāo)檢測(cè)器性能:1.2~3.2AP,展示了優(yōu)異的可插拔擴(kuò)展性能。

在與其他目標(biāo)檢測(cè)方法的對(duì)比中,所提方案以較大的優(yōu)勢(shì)超越了流行方案。相比僅采用多尺度尋覽的方法,所提方案僅需2x訓(xùn)練即可取得新的SOTA指標(biāo)52.3AP。相對(duì)于谷歌提出的EfficientDet與SpineNet,所提方法訓(xùn)練時(shí)間更少(僅1/20);

當(dāng)同時(shí)采用多尺度訓(xùn)練與測(cè)試時(shí),所提方法取得了新的SOTA指標(biāo)54.0AP,以1.3AP指標(biāo)優(yōu)于此前最佳。

當(dāng)引入更優(yōu)異的Transformer骨干網(wǎng)絡(luò)、以及通過類似于谷歌自我學(xué)習(xí)方法生成的額外偽框的ImageNet數(shù)據(jù)后,所提方案取得了COCO新的記錄:60.6 AP,成為首個(gè)超過60的單模型方法。

責(zé)任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:刷新記錄! CVPR2021全新目標(biāo)檢測(cè)機(jī)制達(dá)到SOTA!

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    模型捉蟲行家MV:致力全流程模型動(dòng)態(tài)測(cè)試

    隨著基于模型設(shè)計(jì)(MBD)開發(fā)量的增長(zhǎng),其對(duì)應(yīng)的測(cè)試需求也顯著提升。此前,在《您的模型診斷專家MI:助力把好模型質(zhì)量關(guān)》一文中詳述了模型靜態(tài)
    的頭像 發(fā)表于 07-09 16:37 ?503次閱讀
    <b class='flag-5'>模型</b>捉蟲行家MV:致力全流程<b class='flag-5'>模型</b>動(dòng)態(tài)<b class='flag-5'>測(cè)試</b>

    單模八芯光纖使用方法指南

    單模八芯光纖(通常指單模8芯束管式或帶狀光纖)的使用方法涵蓋安裝、熔接、測(cè)試、維護(hù)等關(guān)鍵環(huán)節(jié),需結(jié)合其結(jié)構(gòu)特性和應(yīng)用場(chǎng)景進(jìn)行規(guī)范操作。以下是具體使用指南: 一、單模八芯光纖結(jié)構(gòu)解析 核
    的頭像 發(fā)表于 06-26 09:51 ?149次閱讀

    是德科技AP5000系列模擬信號(hào)源在接收機(jī)測(cè)試中的應(yīng)用

    利用是德科技AP5000系列高精度、經(jīng)濟(jì)型模擬信號(hào)源,對(duì)接收機(jī)測(cè)試中的功率進(jìn)行精細(xì)校準(zhǔn)。
    的頭像 發(fā)表于 05-16 09:14 ?251次閱讀
    是德科技<b class='flag-5'>AP</b>5000系列模擬信號(hào)源在接收機(jī)<b class='flag-5'>測(cè)試</b>中的應(yīng)用

    多模光纖可以接單模

    多模光纖不能直接連接單模光纖,強(qiáng)行連接會(huì)導(dǎo)致信號(hào)無法正常傳輸,甚至可能損壞設(shè)備。以下是具體原因及解決方案: 一、多模與單模光纖的核心差異 二、直接連接的風(fēng)險(xiǎn) 光信號(hào)無法耦合 多模光纖的芯徑遠(yuǎn)大于單模
    的頭像 發(fā)表于 04-09 10:19 ?1143次閱讀
    多模光纖可以接<b class='flag-5'>單模</b>嗎

    愛立信攜手Telstra、高通刷新5G上行鏈路速度紀(jì)錄

    愛立信、Telstra、高通近日攜手創(chuàng)下5G上行鏈路516 Mbps速度新紀(jì)錄,成為目前在商用Sub-6GHz 5G SA現(xiàn)網(wǎng)實(shí)現(xiàn)的最高上行鏈路速度。
    的頭像 發(fā)表于 03-26 16:31 ?1w次閱讀

    為什么無法使用OpenVINO?模型優(yōu)化器轉(zhuǎn)換TensorFlow 2.4模型?

    已下載 ssd_mobilenet_v2_fpnlite_640x640_coco17_tpu-8 型號(hào)。 使用將模型轉(zhuǎn)換為中間表示 (IR) ssd_support_api_v.2.4.json
    發(fā)表于 03-05 09:07

    無法將自定義COCO數(shù)據(jù)集導(dǎo)入到OpenVINO? DL Workbench怎么解決?

    以精確 FP32 將自定義模型轉(zhuǎn)換為中間表示 (IR) 格式。 使用未注注的數(shù)據(jù)集和默認(rèn)配置將 IR (FP32) 轉(zhuǎn)換為 IR (INT8)。 使用 IR(INT8)推斷造成糟糕的結(jié)果。 創(chuàng)建
    發(fā)表于 03-05 06:02

    JCMsuite—單模光纖傳播模式

    所需參數(shù)的詳細(xì)描述。 下圖顯示了兩個(gè)計(jì)算本征模的電場(chǎng)的z分量(對(duì)數(shù)尺度下)。兩者都屬于相同的有效折射率,屬于雙重簡(jiǎn)并。特征值存儲(chǔ)在文件eigenvalues.jcm中。 之后彎曲單模光纖教程會(huì)說明如何計(jì)算彎曲單模光纖的基本傳播模式。
    發(fā)表于 01-09 08:57

    是德科技推出全新AP5001A和AP5002A射頻微波模擬源

    在射頻微波測(cè)試的前沿領(lǐng)域,是德科技重磅推出全新的AP5001A和AP5002A射頻微波模擬源。這兩款新品以其卓越非凡的快速頻率切換功能,為各類復(fù)雜嚴(yán)苛的測(cè)試應(yīng)用場(chǎng)景帶來了前所未有的高效
    的頭像 發(fā)表于 12-18 15:46 ?998次閱讀
    是德科技推出全新<b class='flag-5'>AP</b>5001A和<b class='flag-5'>AP</b>5002A射頻微波模擬源

    光纖單模 雙模怎么看

    要區(qū)分光纖是單模還是雙模(通常所說的“雙模”光纖實(shí)際上是指多模光纖),可以通過以下幾種方法: 一、顏色區(qū)分 單模光纖:通常用黃色表示,其接頭和保護(hù)套為藍(lán)色。 多模光纖:一般用橙色或灰色來表示,接頭
    的頭像 發(fā)表于 11-14 09:56 ?1.2w次閱讀

    NVIDIA文本嵌入模型NV-Embed的精度基準(zhǔn)

    NVIDIA 的最新嵌入模型 NV-Embed —— 以 69.32 的分?jǐn)?shù)創(chuàng)下了嵌入準(zhǔn)確率的新紀(jì)錄海量文本嵌入基準(zhǔn)測(cè)試(MTEB)涵蓋 56 項(xiàng)嵌入任務(wù)。
    的頭像 發(fā)表于 08-23 16:54 ?2490次閱讀
    NVIDIA文本嵌入<b class='flag-5'>模型</b>NV-Embed的精度基準(zhǔn)

    如何解決單模光模塊使用多模光纖的問題

    單模光模塊和多模光模塊是兩種不同類型的光模塊,它們?cè)诠饫w通信系統(tǒng)中有著不同的應(yīng)用場(chǎng)景。 單模光模塊和多模光模塊的定義 單模光模塊和多模光模塊都是光纖通信系統(tǒng)中的關(guān)鍵組件,它們的主要區(qū)別在于所
    的頭像 發(fā)表于 08-23 09:47 ?2481次閱讀

    單模單纖與單模雙纖的哪個(gè)穩(wěn)定?

    單模單纖與單模雙纖是兩種常見的光纖通信方式,它們?cè)诜€(wěn)定性、傳輸距離、成本等方面存在一定的差異。 一、單模單纖與單模雙纖的基本概念 1.1 單模
    的頭像 發(fā)表于 08-08 17:03 ?1973次閱讀

    單模單纖與單模雙纖的優(yōu)缺點(diǎn)是什么

    單模單纖和單模雙纖是光纖通信系統(tǒng)中的兩種常見配置方式。它們?cè)诠饫w通信系統(tǒng)中有著各自的優(yōu)缺點(diǎn)。 一、單模單纖 定義 單模單纖是指在光纖通信系統(tǒng)中,只使用一根
    的頭像 發(fā)表于 08-08 17:01 ?3132次閱讀

    單模鎧裝光纜與室外單模光纜區(qū)別

    單模鎧裝光纜與室外單模光纜在多個(gè)方面存在顯著區(qū)別,以下是對(duì)兩者區(qū)別的詳細(xì)分析: 一、外觀與結(jié)構(gòu) 外觀顏色:單模鎧裝光纜一般是黑色的,而室外單模光纜通常是黃色的。這種顏色差異有助于在實(shí)際
    的頭像 發(fā)表于 07-29 10:04 ?1173次閱讀