一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何學(xué)習(xí)基于Tansformer的目標(biāo)檢測算法呢?

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-08-07 16:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

說到純視覺的自動駕駛方案,大家第一個想到的就是Tesla吧。的確,早在2021年,Tesla就已經(jīng)實現(xiàn)了純視覺的BEV檢測方案,而且效果非常好。

240e9aa2-32e1-11ee-9e74-dac502259ad0.png

細(xì)心的同學(xué)可能發(fā)現(xiàn)了,這套BEV方案中將相機(jī)空間的圖像轉(zhuǎn)換到BEV空間的核心組件就是Transformer。

Transformer來源于自然語言處理領(lǐng)域,首先被應(yīng)用于機(jī)器翻譯。后來,大家發(fā)現(xiàn)它在計算機(jī)視覺領(lǐng)域效果也很不錯,而且在各大排行榜上碾壓CNN網(wǎng)絡(luò)。

2435d4a0-32e1-11ee-9e74-dac502259ad0.png

目標(biāo)檢測領(lǐng)域中,視覺Transformer不僅可以實現(xiàn)2D檢測、3D檢測,還可以實現(xiàn)多模態(tài)檢測,BEV視角下的檢測,性能也非常出色。

245b52ac-32e1-11ee-9e74-dac502259ad0.png

因此,掌握Transformer相關(guān)知識和工程基礎(chǔ)成為了企業(yè)招聘算法工程師的一個技能要求點,也是簡歷上的一個很大的加分項。

然而,想要掌握基于Transformer的目標(biāo)檢測算法,有以下3個難點

理解Transformer背后的理論基礎(chǔ),比如自注意力機(jī)制(self-attention), 位置編碼(positional embedding),目標(biāo)查詢(object query)等等,網(wǎng)上的資料比較雜亂,不夠系統(tǒng),難以通過自學(xué)做到深入理解并融會貫通。

2475f544-32e1-11ee-9e74-dac502259ad0.png

掌握基于Transformer的目標(biāo)檢測算法的思路和創(chuàng)新點,一些Transformer論文涉及的新概念比較多,話術(shù)沒有那么通俗易懂,讀完論文仍然不理解算法的細(xì)節(jié)部分。

24a3cd02-32e1-11ee-9e74-dac502259ad0.png2

Transformer代碼不易看懂,因為作用機(jī)制與CNN有不少差別,所以完全理解代碼并實踐應(yīng)用需要花費很大功夫。

24c35ec4-32e1-11ee-9e74-dac502259ad0.png3

那么如何學(xué)習(xí)基于Tansformer的目標(biāo)檢測算法呢?

實踐部分

24d6a84e-32e1-11ee-9e74-dac502259ad0.png24fc84a6-32e1-11ee-9e74-dac502259ad0.png






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1709

    瀏覽量

    46779
  • 自動駕駛
    +關(guān)注

    關(guān)注

    789

    文章

    14321

    瀏覽量

    170650
  • Transformer
    +關(guān)注

    關(guān)注

    0

    文章

    151

    瀏覽量

    6520

原文標(biāo)題:Transformer在自動駕駛中的應(yīng)用前景怎么樣?

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于FPGA的SSD目標(biāo)檢測算法設(shè)計

    隨著人工智能的發(fā)展,神經(jīng)網(wǎng)絡(luò)正被逐步應(yīng)用于智能安防、自動駕駛、醫(yī)療等各行各業(yè)。目標(biāo)識別作為人工智能的一項重要應(yīng)用也擁有著巨大的前景,隨著深度學(xué)習(xí)的普及和框架的成熟,卷積神經(jīng)網(wǎng)絡(luò)模型的識別精度越來越高
    的頭像 發(fā)表于 07-10 11:12 ?847次閱讀
    基于FPGA的SSD<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測算法</b>設(shè)計

    【嘉楠堪智K230開發(fā)板試用體驗】K230機(jī)器視覺相關(guān)功能體驗

    畫圖 機(jī)器學(xué)習(xí)模型在通過攝像頭獲取圖像后,經(jīng)過處理輸入后,在輸出環(huán)節(jié)通常還需要進(jìn)行后處理,例如圖像檢測應(yīng)用中,目標(biāo)位置的框選等。 在K230中提供了畫圖的功能,可以實現(xiàn)畫線段、畫矩形、畫圓、畫箭頭
    發(fā)表于 07-08 17:25

    基于RK3576開發(fā)板的車輛檢測算法

    車輛檢測是一種基于深度學(xué)習(xí)的對人進(jìn)行檢測定位的目標(biāo)檢測,能廣泛的用于園區(qū)管理、交通分析等多種場景,是違停識別、堵車識別、車流統(tǒng)計等多種
    的頭像 發(fā)表于 05-08 17:34 ?912次閱讀
    基于RK3576開發(fā)板的車輛<b class='flag-5'>檢測算法</b>

    基于RK3576開發(fā)板的安全帽檢測算法

    安全帽佩戴檢測是工地、生產(chǎn)安全、安防的重中之重,但人為主觀檢測的方式時效性差且不能全程監(jiān)控。AI技術(shù)的日漸成熟催生了安全帽佩戴檢測方案,成為了監(jiān)督佩戴安全帽的利器。本安全帽檢測算法是一
    的頭像 發(fā)表于 05-08 16:59 ?1585次閱讀
    基于RK3576開發(fā)板的安全帽<b class='flag-5'>檢測算法</b>

    基于RK3576開發(fā)板的人員檢測算法

    展示了RK3576開發(fā)板的人員檢測算法例程及API說明
    的頭像 發(fā)表于 05-07 17:33 ?299次閱讀
    基于RK3576開發(fā)板的人員<b class='flag-5'>檢測算法</b>

    基于RV1126開發(fā)板的車輛檢測算法開發(fā)

    車輛檢測是一種基于深度學(xué)習(xí)的對人進(jìn)行檢測定位的目標(biāo)檢測,能廣泛的用于園區(qū)管理、交通分析等多種場景,是違停識別、堵車識別、車流統(tǒng)計等多種
    的頭像 發(fā)表于 04-14 16:00 ?293次閱讀
    基于RV1126開發(fā)板的車輛<b class='flag-5'>檢測算法</b>開發(fā)

    基于RV1126開發(fā)板的吸煙檢測算法開發(fā)

    吸煙檢測是一種基于深度學(xué)習(xí)的對抽煙人群進(jìn)行檢測定位的目標(biāo)檢測,能廣泛的用于安防、生產(chǎn)安全、園區(qū)管理等多種場景。配合攝像頭,實時識別監(jiān)控區(qū)內(nèi)人
    的頭像 發(fā)表于 04-14 15:37 ?297次閱讀
    基于RV1126開發(fā)板的吸煙<b class='flag-5'>檢測算法</b>開發(fā)

    基于RV1126開發(fā)板的安全帽檢測算法開發(fā)

    安全帽佩戴檢測是工地、生產(chǎn)安全、安防的重中之重,但人為主觀檢測的方式時效性差且不能全程監(jiān)控。AI技術(shù)的日漸成熟催生了安全帽佩戴檢測方案,成為了監(jiān)督佩戴安全帽的利器。本安全帽檢測算法是一
    的頭像 發(fā)表于 04-14 15:10 ?289次閱讀
    基于RV1126開發(fā)板的安全帽<b class='flag-5'>檢測算法</b>開發(fā)

    基于RV1126開發(fā)板的火焰檢測算法開發(fā)

    火焰檢測是一種基于深度學(xué)習(xí)的對火焰進(jìn)行檢測定位的目標(biāo)檢測?;诖笠?guī)模火焰數(shù)據(jù)識別訓(xùn)練,配合攝像頭,實時識別監(jiān)控區(qū)內(nèi)明火情況立刻發(fā)出警報,提醒
    的頭像 發(fā)表于 04-14 14:53 ?327次閱讀
    基于RV1126開發(fā)板的火焰<b class='flag-5'>檢測算法</b>開發(fā)

    基于RV1126開發(fā)板的人臉檢測算法開發(fā)

    在RV1126上開發(fā)人臉檢測算法組件
    的頭像 發(fā)表于 04-14 10:19 ?329次閱讀
    基于RV1126開發(fā)板的人臉<b class='flag-5'>檢測算法</b>開發(fā)

    軒轅智駕紅外目標(biāo)檢測算法在汽車領(lǐng)域的應(yīng)用

    在 AI 技術(shù)蓬勃發(fā)展的當(dāng)下,目標(biāo)檢測算法取得了重大突破,其中紅外目標(biāo)檢測算法更是在汽車行業(yè)掀起了波瀾壯闊的變革,從根本上重塑著汽車的安全性能、駕駛體驗與產(chǎn)業(yè)生態(tài)。
    的頭像 發(fā)表于 03-27 15:55 ?428次閱讀

    睿創(chuàng)微納推出新一代目標(biāo)檢測算法

    隨著AI技術(shù)的發(fā)展,目標(biāo)檢測算法也迎來重大突破。睿創(chuàng)微納作為熱成像領(lǐng)軍者,憑借深厚的技術(shù)積累與創(chuàng)新能力,結(jié)合AI技術(shù)推出新一代目標(biāo)檢測算法,以三大核心技術(shù)帶來AI視覺感知全場景解決方案
    的頭像 發(fā)表于 03-20 13:49 ?435次閱讀

    采用華為云 Flexus 云服務(wù)器 X 實例部署 YOLOv3 算法完成目標(biāo)檢測

    一、前言 1.1 開發(fā)需求 這篇文章講解:?采用華為云最新推出的 Flexus 云服務(wù)器 X 實例部署 YOLOv3 算法,完成圖像分析、目標(biāo)檢測。 隨著計算機(jī)視覺技術(shù)的飛速發(fā)展,深度學(xué)習(xí)
    的頭像 發(fā)表于 01-02 12:00 ?543次閱讀
    采用華為云 Flexus 云服務(wù)器 X 實例部署 YOLOv3 <b class='flag-5'>算法</b>完成<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b>

    在樹莓派上部署YOLOv5進(jìn)行動物目標(biāo)檢測的完整流程

    目標(biāo)檢測在計算機(jī)視覺領(lǐng)域中具有重要意義。YOLOv5(You Only Look One-level)是目標(biāo)檢測算法中的一種代表性方法,以其高效性和準(zhǔn)確性備受關(guān)注,并且在各種
    的頭像 發(fā)表于 11-11 10:38 ?3720次閱讀
    在樹莓派上部署YOLOv5進(jìn)行動物<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b>的完整流程

    旗晟機(jī)器人環(huán)境檢測算法有哪些?

    硬件支撐,更離不開強(qiáng)大的算法庫作為軟件核心,二者相輔相成,缺一不可。今天就來了解旗晟機(jī)器人環(huán)境檢測算法。 1、設(shè)施異常監(jiān)測 通過集成高精度傳感器與智能圖像識別技術(shù)。它不僅能檢測A字梯是否存在變形,還能精確評估梯腳
    的頭像 發(fā)表于 07-19 17:54 ?869次閱讀
    旗晟機(jī)器人環(huán)境<b class='flag-5'>檢測算法</b>有哪些?