一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于深度圖像的人體關(guān)節(jié)定位算法

新機(jī)器視覺 ? 來源:上海交大類腦智能應(yīng)用技 ? 作者:上海交大類腦智能 ? 2022-07-15 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人體姿態(tài)估計是當(dāng)前計算機(jī)視覺領(lǐng)域的熱點(diǎn)研究問題。對人體骨架關(guān)節(jié)點(diǎn)進(jìn)行準(zhǔn)確提取并構(gòu)建人體骨架模型,為進(jìn)一步的人體姿態(tài)識別、實(shí)時交互游戲等應(yīng)用提供了基礎(chǔ)。但是傳統(tǒng)的基于RGB圖像的方法容易受到光照、陰影、復(fù)雜背景的影響,準(zhǔn)確度不高并且算法復(fù)雜。利用深度圖像技術(shù)可以有效地解決上述問題,利用深度信息可以快速地進(jìn)行背景分割,抗干擾性能好,算法效率高。

本文主要研究基于深度圖像的人體關(guān)節(jié)定位算法。算法對深度圖像素點(diǎn)周圍區(qū)域的深度進(jìn)行格點(diǎn)化采樣以提取其深度特征,再使用隨機(jī)森林分類器進(jìn)行像素點(diǎn)分類,對同一類別的點(diǎn)使用Mean Shift算法聚類出中心點(diǎn),以該中心點(diǎn)作為關(guān)節(jié)點(diǎn)位置。該算法可對人體全身關(guān)節(jié)點(diǎn)進(jìn)行定位。

局域深度特征提取

本文中采用如圖1所示的局域深度采樣特征。其中藍(lán)色點(diǎn)表示圖像I中給定的像素x,以該像素為中心生成一個5*5的格點(diǎn)矩陣,紅色的格點(diǎn)表示要進(jìn)行深度采樣的點(diǎn)。

734edd8c-037d-11ed-ba43-dac502259ad0.png

圖1 局域深度采樣示意圖

隨機(jī)森林分類器

分類器是對樣本進(jìn)行分類的算法的統(tǒng)稱,在機(jī)器學(xué)習(xí)中有許多種分類器可供我們選擇使用,包括邏輯回歸、樸素貝葉斯、支持向量機(jī)(SVM)、決策樹、隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)等算法。綜合考慮分類的精度與效率,本課題中采用的是隨機(jī)森林分類器。

隨機(jī)森林分類器是由多棵決策樹組合而成的分類器,如圖2所示。決策樹的結(jié)構(gòu)類似二叉樹,由分裂結(jié)點(diǎn)和葉結(jié)點(diǎn)構(gòu)成。每一個分裂結(jié)點(diǎn)包含一個特征與閾值,像素x從根部開始,根據(jù)特征與閾值劃分進(jìn)入左子樹還是右子樹,這樣不斷地分裂直到葉結(jié)點(diǎn)。在每棵樹的葉結(jié)點(diǎn)能夠得到該像素對于各個身體部件的概率分布,將各棵樹得到的結(jié)果相加,得到最終的概率分布,擁有最高概率的一類作為最終的分類結(jié)果。

隨機(jī)森林將多棵決策樹合并在一起,準(zhǔn)確度相較于單棵決策樹有較大提升,并且多棵決策樹可以并行訓(xùn)練,提高了訓(xùn)練效率。

735cdb58-037d-11ed-ba43-dac502259ad0.png

圖2隨機(jī)森林分類器

訓(xùn)練完隨機(jī)森林分類器后,我們利用其對像素點(diǎn)進(jìn)行分類,判斷其屬于身體的哪個部位。對于圖像中的每個像素,使用分類器對其分類后得到分類的結(jié)果,以及預(yù)測結(jié)果的概率。我們只選取圖像中預(yù)測概率高于80%的點(diǎn),這樣就能得到密度不同的分類點(diǎn)。越靠近關(guān)節(jié)點(diǎn)位置,預(yù)測概率越高,點(diǎn)的密度越大,遠(yuǎn)離關(guān)節(jié)點(diǎn)位置的密度則小。

關(guān)節(jié)點(diǎn)位置估計

在得到像素點(diǎn)分類后,我們使用Mean Shift聚類算法得到屬于同一部位像素點(diǎn)的中心,作為關(guān)節(jié)位置。

Mean Shift算法一般為一個迭代過程,先計算感興趣區(qū)域內(nèi)的偏移均值,移動區(qū)域中心到計算出的質(zhì)心處,然后以此處作為新的起點(diǎn),繼續(xù)移動。在迭代過程中,不斷向密度更大的地方偏移,直到移動到這類像素點(diǎn)密度最高的中心位置而停止。此時這個位置最能代表這一類點(diǎn),我們將其作為該部位的關(guān)節(jié)點(diǎn)位置。分別對所有類別的點(diǎn)都運(yùn)行一遍此算法后,我們就能得到全身關(guān)節(jié)點(diǎn)的位置。

但是由于分類結(jié)果并不一定準(zhǔn)確,聚類出的結(jié)果可能與真實(shí)關(guān)節(jié)點(diǎn)的位置有所偏移,這時我們可以采用人體骨架長度比例約束條件,來矯正一部分偏移較大的關(guān)節(jié)點(diǎn),對預(yù)測結(jié)果進(jìn)行優(yōu)化。

流程介紹

訓(xùn)練流程:對一幅深度圖,取關(guān)節(jié)附近的點(diǎn)作為訓(xùn)練集,對這些點(diǎn)提取深度特征,再訓(xùn)練隨機(jī)森林分類器

736b3266-037d-11ed-ba43-dac502259ad0.png

圖3訓(xùn)練流程示意圖

測試流程:深度圖背景分割得到人體區(qū)域圖像,使用隨機(jī)森林分類器對人體的像素點(diǎn)進(jìn)行分類,選取預(yù)測概率大于設(shè)定閾值的點(diǎn),則得到疏密不同的各關(guān)節(jié)部位像素點(diǎn),越接近關(guān)節(jié)點(diǎn)位置,像素點(diǎn)越密,再使用Mean shift算法進(jìn)行聚類,得到關(guān)節(jié)點(diǎn)位置

739e8a26-037d-11ed-ba43-dac502259ad0.png

測試流程示意圖

運(yùn)行效果

圖4為關(guān)節(jié)定位算法的運(yùn)行效果,(a)為NTU數(shù)據(jù)集中關(guān)節(jié)點(diǎn)的標(biāo)準(zhǔn)位置;(b)是算法對同一張深度圖中關(guān)節(jié)點(diǎn)的定位結(jié)果;(c)為自制的Kinect測試集上的運(yùn)行效果;(d)為采用公司研制的TOF相機(jī)模塊拍攝的深度圖的運(yùn)行效果??梢灾庇^地看出定位效果較為良好。TOF相機(jī)的分辨率為320*240,因此相同距離下人體在畫面中所占比例更大。

73aacc8c-037d-11ed-ba43-dac502259ad0.png

(a) (b)

73c01f6a-037d-11ed-ba43-dac502259ad0.png

(c) (d)

圖4 算法運(yùn)行效果示例

注:

(a)NTU測試集真值,25關(guān)節(jié)

(b)NTU測試集

(c)自制測試集

(d)TOF相機(jī)拍攝圖像

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4710

    瀏覽量

    95409
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134637
  • 深度圖像
    +關(guān)注

    關(guān)注

    0

    文章

    19

    瀏覽量

    3612

原文標(biāo)題:3D視覺在人體姿態(tài)估計算法的應(yīng)用

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于衛(wèi)星圖像的智能定位系統(tǒng)軟件

    基于衛(wèi)星圖像的智能定位系統(tǒng)軟件是衛(wèi)星導(dǎo)航、圖像處理與智能算法融合的前沿技術(shù)結(jié)晶,在高精度定位領(lǐng)域具有卓越表現(xiàn)。以下是對這類軟件的詳細(xì)介紹:
    的頭像 發(fā)表于 04-01 09:55 ?389次閱讀

    基于衛(wèi)星圖像的智能定位系統(tǒng)全面解析

    智慧華盛恒輝基于衛(wèi)星圖像的智能定位系統(tǒng),作為融合衛(wèi)星導(dǎo)航、圖像處理以及智能算法的前沿科技,在高精度定位領(lǐng)域表現(xiàn)卓越。下面為您全方位深入剖析該
    的頭像 發(fā)表于 03-31 16:55 ?381次閱讀

    電學(xué)電壓放大器基于靜電傳感器的人體室內(nèi)定位研究的應(yīng)用

    實(shí)驗(yàn)名稱:基于靜電傳感器的人體室內(nèi)定位研究 測試目的:設(shè)計并制作了一種能夠?qū)?b class='flag-5'>人體運(yùn)動進(jìn)行檢測的靜電傳感器。靜電傳感器由感應(yīng)電極與信號調(diào)理電路組成,調(diào)理電路包括電荷放大器、電壓放大器、截止頻率為
    的頭像 發(fā)表于 03-18 11:16 ?300次閱讀
    電學(xué)電壓放大器基于靜電傳感器<b class='flag-5'>的人體</b>室內(nèi)<b class='flag-5'>定位</b>研究的應(yīng)用

    VirtualLab Fusion應(yīng)用:錐形相位掩模的Talbot圖像

    摘要 在傳統(tǒng)的 Talbot 光刻中,在光敏層中僅使用一個圖像。 但是,可以使用特殊的相位掩模以深度方式生成相位掩模的兩個圖像。 在本案例中,按照 I.-H. Lee 等人在 VirtualLab
    發(fā)表于 02-26 08:54

    DLPC7540EVM是否支持自定義的圖像處理算法,以及如何進(jìn)行算法的移植?

    是否支持自定義的圖像處理算法,以及如何進(jìn)行算法的移植?
    發(fā)表于 02-17 08:25

    亞歷山大醫(yī)院研發(fā)全球新穎的人工智能算法(已獲國際專利)

    一種用于機(jī)器人全膝關(guān)節(jié)置換(rTKR)的人工智能算法獲得了國際專利合作條約(PCT)專利,保護(hù)機(jī)器人全膝關(guān)節(jié)置換的計算算法的獨(dú)特性,新穎性和專有權(quán)。該專利自2024年八月起在150多個
    的頭像 發(fā)表于 02-15 10:16 ?324次閱讀

    FPGA上的圖像處理算法集成與優(yōu)化

    、Tophat形態(tài)學(xué)濾波、RAW8轉(zhuǎn)RGB888、彩色圖像均值濾波、Alpha背景疊加、直方圖灰度拉伸算法以及自動白平衡算法。每種算法都提供了實(shí)現(xiàn)方法和相關(guān)公式,涵蓋了
    的頭像 發(fā)表于 02-14 13:46 ?660次閱讀
    FPGA上的<b class='flag-5'>圖像</b>處理<b class='flag-5'>算法</b>集成與優(yōu)化

    矽典微新品XenD101H人體生命存在感應(yīng)參考設(shè)計

    靜止人體生命存在毫米波傳感器采用FMCW調(diào)頻連續(xù)波技術(shù),對空間內(nèi)的靜止、微動、運(yùn)動的人體目標(biāo)進(jìn)行探測,通過精確的生命存在感應(yīng)和測距算法,即可獨(dú)立配置區(qū)間感應(yīng)靈敏度,也可以自動化生成傳感器配置參數(shù)
    的頭像 發(fā)表于 12-30 15:29 ?542次閱讀
    矽典微新品XenD101H<b class='flag-5'>人體</b>生命存在感應(yīng)參考設(shè)計

    ADS1293獲取的人體心電信號,如何實(shí)現(xiàn)隔直?

    1. ADS1293獲取的人體心電信號,如何實(shí)現(xiàn)隔直?ECG信號沒有隔直處理的話,基線會偏離0電壓位置,并且不同的人在不同的時間,偏置的電壓不盡相同。 2. ADS1293評估板手冊上,波形十分
    發(fā)表于 12-10 08:25

    使用ADS1298測出的人體心電信號基準(zhǔn)線不在Y=0軸,如何解決呢?

    這是我采用加壓單極左下肢導(dǎo)聯(lián)實(shí)測出的人體心電信號,但是基準(zhǔn)線不在Y=0軸上,而且每次飄忽不定,總需要重新調(diào)整坐標(biāo)軸,大家有沒有什么解決的辦法呢?謝謝啦。
    發(fā)表于 12-03 08:05

    常見人體姿態(tài)評估顯示方式的兩種方式

    人體姿態(tài)評估中有兩種常見的顯示方式,分別是火柴人效果與BodyPix效果。其中火柴人效果本質(zhì)就是基于關(guān)鍵點(diǎn)的深度學(xué)習(xí)模型推理以后的顯示效果;Bodypix本質(zhì)就就是語義分割模型
    的頭像 發(fā)表于 11-11 11:21 ?666次閱讀
    常見<b class='flag-5'>人體</b>姿態(tài)評估顯示方式的兩種方式

    圖像算法工程師的利器——SpeedDP深度學(xué)習(xí)算法開發(fā)平臺

    隨著人工智能的興起,AI工程師特別是基于圖像算法工程師日益成為炙手可熱的香餑餑。特別是在一些行業(yè)市場例如工業(yè)領(lǐng)域等行業(yè)領(lǐng)域,需要根據(jù)具體場景對檢測識別算法進(jìn)行不斷地優(yōu)化完善,以達(dá)到更高的準(zhǔn)確率
    的頭像 發(fā)表于 11-08 01:06 ?831次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>算法</b>工程師的利器——SpeedDP<b class='flag-5'>深度</b>學(xué)習(xí)<b class='flag-5'>算法</b>開發(fā)平臺

    深度識別算法包括哪些內(nèi)容

    :CNN是深度學(xué)習(xí)中處理圖像和視頻等具有網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的主要算法。它通過卷積層、池化層和全連接層等組件,實(shí)現(xiàn)對圖像特征的自動提取和識別。 應(yīng)用領(lǐng)域 :CNN在
    的頭像 發(fā)表于 09-10 15:28 ?844次閱讀

    可穿戴設(shè)備的人體成分測量 (BCM)申請簡介

    電子發(fā)燒友網(wǎng)站提供《可穿戴設(shè)備的人體成分測量 (BCM)申請簡介.pdf》資料免費(fèi)下載
    發(fā)表于 09-10 09:22 ?0次下載
    可穿戴設(shè)備<b class='flag-5'>的人體</b>成分測量 (BCM)申請簡介

    基于新型藍(lán)牙技術(shù)的人定位方案

    云酷科技“基于新型藍(lán)牙技術(shù)的人定位項目”在結(jié)合行業(yè)相關(guān)制度及項目管理經(jīng)驗(yàn)基礎(chǔ)上,利用藍(lán)牙定位、4G/5G通訊等技術(shù),以較低成本投入,實(shí)現(xiàn)生產(chǎn)區(qū)域的“作業(yè)安全”、“人員安全”、“機(jī)具安全”閉環(huán)管理
    的頭像 發(fā)表于 09-03 11:57 ?471次閱讀