近日,中國科學(xué)院自動(dòng)化研究所智能感知與計(jì)算研究中心研究員張兆翔及其團(tuán)隊(duì)借鑒腦神經(jīng)機(jī)制與視覺認(rèn)知機(jī)理,在視覺物體檢測模型與方法上取得一系列進(jìn)展,共有5篇文章被ICCV2019錄用,1篇文章被NeurIPS2019錄用,1篇文章被JMLR 期刊收錄。本次著重介紹基于三叉戟網(wǎng)絡(luò)(Trident Networks)的物體檢測。
物體檢測是計(jì)算機(jī)視覺與模式識(shí)別領(lǐng)域的核心問題,一直以來受到學(xué)術(shù)界與工業(yè)界的廣泛關(guān)注。當(dāng)前物體檢測最大的難點(diǎn)是如何對場景中多種尺度的物體進(jìn)行有效表征,進(jìn)而進(jìn)行更為高效、更為準(zhǔn)確、更為魯棒的物體檢測。
在二維透視成像中,近大遠(yuǎn)小是一個(gè)常見的現(xiàn)象,如圖1所示。這一透視關(guān)系,幫助人類視覺系統(tǒng)形成對三維空間的感知。但對于基于二維圖像的視覺感知任務(wù)而言,近大遠(yuǎn)小會(huì)導(dǎo)致相同真實(shí)大小的物體根據(jù)遠(yuǎn)近不同,因而在成像平面上形成不同尺度的物體。這將對視覺感知任務(wù)提出挑戰(zhàn)。具體來說:(1)這會(huì)導(dǎo)致信息的衰減,二維圖像捕獲的信息隨距離二次衰減,因而30米外的物體在圖片上可能只有15米外相同物體1/4的像素;(2)卷積神經(jīng)網(wǎng)絡(luò)具有局限性。由于卷積操作在二維平面上采用相同大小的滑動(dòng)窗口進(jìn)行計(jì)算,同一卷積操作無法同時(shí)對尺度差異較大的物體進(jìn)行響應(yīng)。
針對傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的局限,張兆翔及其團(tuán)隊(duì)首次提出 Trident 網(wǎng)絡(luò)結(jié)構(gòu)。首先通過不同膨脹系數(shù)的卷積支路實(shí)現(xiàn)對不同尺度的物體的識(shí)別,然后通過權(quán)重共享實(shí)現(xiàn)對不同尺度相同物體的一致性刻畫。研究人員還提出了一種在測試階段只需要一條卷積支路的快速 Trident 網(wǎng)絡(luò),快速 Trident 網(wǎng)絡(luò)保持了與傳統(tǒng)檢測器骨干網(wǎng)絡(luò)相同的計(jì)算量,大幅提升了該方法的實(shí)用性。
該Trident方法可以與不同基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu)結(jié)合,并在 COCO 數(shù)據(jù)集上取得大幅度提升。該文作為Oral文章在ICCV2019發(fā)表。
據(jù)悉,ICCV2019近期在韓國首爾召開。ICCV的全稱是國際計(jì)算機(jī)視覺大會(huì),是計(jì)算機(jī)視覺與模式識(shí)別領(lǐng)域的頂級會(huì)議。本次會(huì)議,張兆翔及其團(tuán)隊(duì)共有5篇論文被接收,其中2篇為oral;3篇為poster。
-
自動(dòng)化
+關(guān)注
關(guān)注
29文章
5780瀏覽量
84828 -
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
9文章
1708瀏覽量
46771 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1224瀏覽量
25445
原文標(biāo)題:自動(dòng)化所在視覺物體檢測與識(shí)別領(lǐng)域取得系列進(jìn)展
文章出處:【微信號:MEMSensor,微信公眾號:MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
EtherCAT科普系列(8):EtherCAT技術(shù)在機(jī)器視覺領(lǐng)域的應(yīng)用

行業(yè)首創(chuàng):基于深度學(xué)習(xí)視覺平臺(tái)的AI驅(qū)動(dòng)輪胎檢測自動(dòng)化

工業(yè)自動(dòng)化中的 Raspberry Pi:簡化經(jīng)濟(jì)實(shí)惠的邊緣計(jì)算

汽車焊接自動(dòng)化檢測技術(shù)進(jìn)展與應(yīng)用前景
開源項(xiàng)目 ! 利用邊緣計(jì)算打造便攜式視覺識(shí)別系統(tǒng)
工業(yè)自動(dòng)化中常用的傳感器類型
CASAIM自動(dòng)化檢測設(shè)備3D尺寸檢測形位公差測量設(shè)備
自動(dòng)化系統(tǒng)中傳感器的應(yīng)用實(shí)例
《DNK210使用指南 -CanMV版 V1.0》第四十一章 YOLO2物體檢測實(shí)驗(yàn)
康耐視AI視覺系統(tǒng)助力自動(dòng)化精準(zhǔn)檢測
生產(chǎn)線自動(dòng)化革新:視覺上下料技術(shù)的精準(zhǔn)應(yīng)用與效率飛躍

聚焦工業(yè)自動(dòng)化領(lǐng)域,港迪技術(shù)IPO上市加碼技術(shù)研發(fā)投入
視覺檢測是什么意思?機(jī)器視覺檢測的適用行業(yè)及場景有哪些?

評論