一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

目標物體識別算法:物體識別算法的一般路徑

新機器視覺 ? 來源:創(chuàng)來科技 ? 作者:創(chuàng)來科技 ? 2021-04-18 10:49 ? 次閱讀

導語:智能駕駛的決策執(zhí)行依賴于對目標物體識別的精準判斷,因而目標物體識別功能也是最早開始研發(fā)的部分。精度、響應度提升是現(xiàn)階段技術關鍵。

物體識別分類對于速度和精度要求極高。一方面,物體的識別和分類是實時的,且結果的置信度要足夠高。由于無人駕駛需要實時做出駕駛決策,而物體識別僅僅是其中一環(huán),在做出判斷前,需要給算法處理、決策效應到執(zhí)行器留有足夠時間,因此留給物體分類和識別器的時間很短,實時性要求非常高。

另一方面,汽車駕駛關系到乘客的生命安全,在此情況下,物體識別必須將誤報、錯判的概率和可能性降低到極低范圍。一旦發(fā)生誤判,系統(tǒng)執(zhí)行錯誤的指令,則結果將是致命的。

目標物體識別難點

?目標物體差異化。


無人駕駛需要依賴算法來識別道路上的各種差異化目標。道路情況十分復雜,面對的物體多種多樣。即使同一類物體,也存在外形、尺寸差異。同時,路面上的物體也可能以組合形式出現(xiàn)。以行人為例,行人有不同的靜態(tài)和動態(tài)差異,靜態(tài)包括行人的外形、服裝、高矮胖瘦、體貌特征差異;動態(tài)差異指行人的運動狀態(tài),可能奔跑、行走或者靜止。這就要求識別算法擁有極高的辨識度,能夠區(qū)分路面上各個不同的物體,精準判斷。

?環(huán)境和路況差異化。

實際道路行駛中,會碰到不同環(huán)境和路況,這就要求識別算法普適所有工況。例如:極端的天氣情況(大雨、大雪、閃電、霧霾等)、不同的光照、不同的路況。

?在動態(tài)場景中進行識別。

在實際道路行駛中周圍的場景都是運動的物體,從不同的視角看過去,不同的物體的坐標變化模式、姿態(tài)變化模式都會不同,識別難度進一步增加。

物體識別算法的一般路徑

物體識別算法通常分為六個步驟:

前處理→前景分離→物體分類→結果改進→物體追蹤→應用層面處理

前五個部分是算法的核心,第六部分則通常指后續(xù)的物體行為預測、路徑規(guī)劃、導航和防碰撞算法等。

c5340072-9fbb-11eb-8b86-12bb97331649.jpg

1

——前處理

此部分為最底層的機器視覺算法,通常包含攝像頭曝光、增益控制、攝像頭標定校準等步驟。由于路況復雜多變而實時性要求很高(例如當車輛快速駛?cè)腭傠x隧道時,周圍的光照變化劇烈,需要迅速做出調(diào)整),無人駕駛中對前處理算法的要求極高。

前處理算法需要保證輸入到后續(xù)步驟的圖像質(zhì)量。圖像質(zhì)量會直接影響后續(xù)分類算法性能。盡管傳統(tǒng)的機器視覺增強算法能夠部分解決這一問題,但是使用高動態(tài)范圍(HDR)的視覺傳感器和配套算法將是未來的主要趨勢。高動態(tài)范圍傳感器可以通過多次曝光運算增強圖片對比度, “照亮” 場景。汽車上使用的 HDR 攝像頭通常還會將近紅外夜視波段也涵蓋進去,實現(xiàn)夜視功能。

傳感器自身的在線標定也在這一部分完成。由于傳感器始終處于運動狀態(tài)中,因此實時確認傳感器自身的姿態(tài)尤為重要。單目攝像頭往往通過跟蹤不同圖像幀之間的差別來確認自身姿態(tài),而雙目攝像頭則使用額外的景深信息來實現(xiàn)這一功能。前者的可靠性較差,而后者則需要更多的計算資源。

2

——前景切分

前景切分的目的是盡可能過濾與待識別物體無關的背景信息(例如天空),并且將圖像切分為適宜大小。一個好的前景切分算法可能將原先的 200k- 1000k 個待識別區(qū)域縮小到 20k-40k,大大減輕后續(xù)處理負擔。主流算法有基于仿生原理的注意力算法等,但是這些算法往往需要依賴于預先收集的數(shù)據(jù),這些數(shù)據(jù)規(guī)定了不同場景下的可能的背景區(qū)間信息。另外,額外的傳感器輸入(包括定位系統(tǒng)、雙目攝像頭或雷達提供的景深信息等)可以進一步加快前景切分。

一旦有了這些額外的信息,前景切分算法對圖像區(qū)域是否處于前景(待識別)的判斷確信度會大幅提升,大量背景區(qū)間將會被去除,大幅減少輸入到物體識別器中的待識別區(qū)域,提高識別的速度和準確性。

c55bc8c8-9fbb-11eb-8b86-12bb97331649.jpg

3

——物體識別

將上一步驟生成的大量待識別區(qū)間歸類為數(shù)百種已知的可能在道路上出現(xiàn)的物體,并且盡量減少誤判。基本上所有的物體識別算法都是以二維圖像作為輸入的。這種輸入分為兩種,一種是將待識別區(qū)域圖像中的邊緣提取出來,將邊緣信息輸入分類器(可以輔以激光雷達以獲得更高精度);另一種則是直接將圖像的外觀輸入到分類器(通過攝像頭實現(xiàn))。前者在性能上基本已經(jīng)到了極限,而后者則是目前研發(fā)的主要方向。

具體到算法,主流的特征提取方法包括梯度方向直方圖法(HOG)和形狀上下文描述符法(SCT),提取特征后進入分類程序。主流的 AI 分類學習算法包括支持向量機(SVM)、迭代分類算法(AdaBoost)和神經(jīng)網(wǎng)絡(NN)。

4

——驗證與結果改進

這一步驟使用與分類方法不同的判據(jù)來驗證分類的結果可靠性,并提取被歸類為特定物體的待識別區(qū)間中更加詳細的信息(例如交通標志)。由于雷達、激光雷達等非視覺傳感器往往能夠滿足“冗余傳感信息來源”這一要求,因此在實際算法中,這一部分也將應用大量的傳感器融合。

c57dbd3e-9fbb-11eb-8b86-12bb97331649.jpg

5

——物體跟蹤

這一步驟的目的有二。除了為應用層提供物體軌跡外,還能為前景切分、物體分類提供輸入(告訴前景切分之前這個地方出現(xiàn)過什么)。目前最為常用的算法是卡爾曼濾波算法(用來跟蹤、預測物體軌跡,根據(jù)過去空間位置預測未來位置)。在物體跟蹤環(huán)節(jié)同樣涉及較多的傳感器融合算法,通過視覺數(shù)據(jù)預測軌跡,同時同雷達的物體跟蹤數(shù)據(jù)進行耦合。

精度和響應速度之間的最優(yōu)選擇

精度是視覺算法的核心,近年來視覺識別算法精度不斷提高。視覺識別算法的精度由誤檢率和漏檢率共同決定。物體識別本身的復雜性決定了這一功能必須以視覺為核心。

縱觀過去十多年,視覺物體識別的精度有了長足的發(fā)展。以美國加州理工學院進行的一項行人識別的算法調(diào)查為例,當誤判率為每張圖 0.1 個行人時,純視覺算法的漏檢率已由 2004 年最早的 95%降低到了最近幾年的 50%附近。

因此我們有理由相信在無人駕駛真正商用時,即使是純視覺算法也能達到很高的物體識別精確度,而若加以傳感器融合(在相同誤判率下約能降低 10%的漏檢率)和強大的車聯(lián)網(wǎng)實時數(shù)據(jù),無人駕駛階段的精度要求將得以滿足。

c5b0fb40-9fbb-11eb-8b86-12bb97331649.jpg

視覺識別算法精度提升途徑

?視覺算法本身的優(yōu)化。在前處理和前景分離階段提取明確目標值,分類和學習系統(tǒng)的算法不斷優(yōu)化。這需要技術研發(fā)的不斷投入,產(chǎn)生極高的進入壁壘,目前國內(nèi)從事視覺算法研究的公司只有少數(shù)幾家,因而也構成了標的稀缺性。

?通過傳感融合算法冗余信息判斷,提高精度。視覺識別以攝像頭數(shù)據(jù)為主,同時輔以雷達、激光雷達的邊界、距離信息。數(shù)據(jù)顯示,在相同誤判率下雷達的決策輔助能降低約 10%的漏檢率。

?利用車聯(lián)網(wǎng)、地圖數(shù)據(jù)的輔助決策。無人駕駛的商用與車聯(lián)網(wǎng)應用密不可分,通過 V2X 實時數(shù)據(jù)傳輸,協(xié)助車輛判斷物體信息,同時通過 GPS 高精度定位和地圖數(shù)據(jù)相結合,輔助物體的分類識別。

另外一個值得關注的問題是各種算法的處理速度。為了保證在高速行駛狀態(tài)下的可靠性,物體識別的圖像輸入速率往往達到了 60~90fps (比一般攝像頭幀數(shù)高 3-4 倍)。即使前景分離步驟每張圖僅產(chǎn)生 20,000 個待識別區(qū)域,流入硬件的待識別區(qū)間也達到了每秒1200,000 個。目前算法在一臺普通計算機下運行速度如下圖所示。

c5cbdeec-9fbb-11eb-8b86-12bb97331649.jpg

面對如此大的計算量,通常情況會有如下幾種解決方法:

第一, 算法上做出妥協(xié)。不使用過于復雜的算法,這意味著精度上要做出妥協(xié)。

第二, 優(yōu)化算法架構,在算法上取得突破,分類器的性能往往是主流算法瓶頸,通過加強在前處理和前景分離過程中的數(shù)據(jù)篩選能力減少傳輸給分類環(huán)節(jié)的數(shù)據(jù)量。

第三, 更加強大的運算芯片。

第四, 定制專門的計算單元來處理物體識別計算,這需要較高的研發(fā)投入。CPU 用來處理日常的運算、排序、組合,GPU用來處理圖像、著色、點距等信息,DSP 應用于處理時間序列信號。三者結合的定制芯片更為實用。

責任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    459

    文章

    51952

    瀏覽量

    433982
  • 識別算法
    +關注

    關注

    0

    文章

    44

    瀏覽量

    10567
  • 無人駕駛
    +關注

    關注

    99

    文章

    4131

    瀏覽量

    122523

原文標題:目標物體識別算法:精度和響應度關乎生命

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    請問訓練平臺訓練完的識別程序,可以實現(xiàn)在識別物體時屏幕再顯示出來,沒有識別物體時屏幕不顯示嗎?

    問題如題,訓練平臺訓練完的識別程序,可以實現(xiàn)在識別物體時屏幕再顯示出來,沒有識別物體時屏幕不顯示嗎?比較小白,可以解釋
    發(fā)表于 04-29 06:12

    人臉識別門禁終端的一般故障排查方法

    問題,有些可能是使用環(huán)境造成,有些可能是人為不小心損壞了。下面,天波小編就來簡單介紹人臉識別門禁終端的一般故障排查方法吧?!倦娫磫栴}】當人臉識別
    的頭像 發(fā)表于 04-27 10:45 ?132次閱讀
    人臉<b class='flag-5'>識別</b>門禁終端的<b class='flag-5'>一般</b>故障排查方法

    在RK3568教學實驗箱上實現(xiàn)基于YOLOV5的算法物體識別案例詳解

    、實驗目的 本節(jié)視頻的目的是了解YOLOv5模型的用途及流程,并掌握基于YOLOV5算法實現(xiàn)物體識別的方法。 二、實驗原理 YOLO(You Only Look Once?。?YOL
    發(fā)表于 12-03 14:56

    物體識別桌 AR物體識互動桌 電容屏實物識別漫游桌

    在這個科技發(fā)達的時代,AR增強技術也在迅速發(fā)展,在展廳展館中發(fā)光發(fā)熱,帶來了創(chuàng)意無限的互動展示效果,AR技術結合物體識別技術打造的AR物體識別桌,讓游客有了全新的體驗,通過新穎的人機交
    的頭像 發(fā)表于 10-21 17:44 ?371次閱讀

    物體識別交互軟件 AR實物識別桌軟件 電容物體識別

    物體識別交互軟件是種新型的展示互動設備,其采用Unity3D技術開發(fā),還運用物體識別技術、多媒體技術等現(xiàn)代先進技術。軟件擁有強大的互動性和
    的頭像 發(fā)表于 10-16 17:22 ?499次閱讀

    目標檢測中大物體的重要性

    ,中等物體提高2個百分點,大物體提高4個百分點)。摘要目標檢測模型是類重要的機器學習算法,旨在識別
    的頭像 發(fā)表于 10-09 08:05 ?692次閱讀
    在<b class='flag-5'>目標</b>檢測中大<b class='flag-5'>物體</b>的重要性

    深度識別算法包括哪些內(nèi)容

    深度識別算法是深度學習領域的個重要組成部分,它利用深度神經(jīng)網(wǎng)絡模型對輸入數(shù)據(jù)進行高層次的理解和識別。深度識別
    的頭像 發(fā)表于 09-10 15:28 ?670次閱讀

    圖像識別算法有哪幾種

    圖像識別算法是計算機視覺領域的核心技術之,它通過分析和處理圖像數(shù)據(jù),實現(xiàn)對圖像中的目標、場景和物體
    的頭像 發(fā)表于 07-16 11:22 ?2063次閱讀

    圖像識別算法都有哪些方法

    圖像識別算法是計算機視覺領域的核心任務之,它涉及到從圖像中提取特征并進行分類、識別和分析的過程。隨著深度學習技術的不斷發(fā)展,圖像識別
    的頭像 發(fā)表于 07-16 11:14 ?6887次閱讀

    圖像識別算法的優(yōu)缺點有哪些

    圖像識別算法種利用計算機視覺技術對圖像進行分析和理解的方法,它在許多領域都有廣泛的應用,如自動駕駛、醫(yī)療診斷、安全監(jiān)控等。然而,圖像識別算法
    的頭像 發(fā)表于 07-16 11:09 ?2607次閱讀

    圖像識別算法的核心技術是什么

    圖像識別算法是計算機視覺領域的個重要研究方向,其目標是使計算機能夠像人類樣理解和識別圖像中的
    的頭像 發(fā)表于 07-16 11:02 ?1044次閱讀

    目標智能識別系統(tǒng)

    智慧華盛恒輝多目標智能識別系統(tǒng)是種利用現(xiàn)代計算機視覺技術和人工智能算法,從圖像或視頻中同時識別和分類多個
    的頭像 發(fā)表于 07-16 10:42 ?2.4w次閱讀

    化工廠液體泄漏識別預警算法

    化工廠液體泄漏識別預警基于圖像識別算法是計算機視覺的基礎算法,例如VGG,GoogLeNet,ResNet等,化工廠液體泄漏識別這類
    的頭像 發(fā)表于 07-03 08:35 ?732次閱讀
    化工廠液體泄漏<b class='flag-5'>識別</b>預警<b class='flag-5'>算法</b>

    人員跌倒識別檢測算法

    人員跌倒識別檢測算法是基于視頻的檢測方法,通過對目標人體監(jiān)測,當目標人體出現(xiàn)突然倒地行為時,自動監(jiān)測并觸發(fā)報警。人員跌倒識別檢測
    的頭像 發(fā)表于 06-30 11:47 ?674次閱讀
    人員跌倒<b class='flag-5'>識別</b>檢測<b class='flag-5'>算法</b>

    Meta探索開發(fā)AI耳機:識別物體和翻譯外語

    據(jù)外媒The Information透露,F(xiàn)acebook母公司Meta正積極研究研發(fā)配備攝像頭的人工智能耳機,旨在實現(xiàn)物體識別與外語實時翻譯功能。
    的頭像 發(fā)表于 05-14 14:26 ?744次閱讀