一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一款只通過單個(gè)普通的2D攝像頭就能實(shí)時(shí)捕捉視頻中的3D動(dòng)作的系統(tǒng)

0wvm_ARchan_TT ? 來源:未知 ? 作者:李倩 ? 2018-05-14 09:53 ? 次閱讀

動(dòng)作捕捉在各行各業(yè)都有著重要的作用,我們實(shí)現(xiàn)它的方法主要有兩種。一是在電影和游戲當(dāng)中經(jīng)常使用的方式,通過在關(guān)節(jié)處貼上標(biāo)志來記錄運(yùn)動(dòng)軌跡;

二則是深度攝像頭,通過紅外來測(cè)量用戶的身體,這個(gè)大家都十分熟悉了。前者根本無法普及,后者在強(qiáng)光下效率低下,但擁有一個(gè)共同的優(yōu)良品質(zhì)—昂貴。

而市場(chǎng)上充滿的是普通智能手機(jī),如果能夠僅僅通過普通智能手機(jī)的攝像頭實(shí)現(xiàn)身體追蹤,那這將是一個(gè)巨大的進(jìn)步。

除了便宜,普通攝像頭較深度攝像頭的另一大優(yōu)勢(shì)就是視野廣,可以用于大場(chǎng)景的使用。同時(shí)基于紅外的深度攝像頭在戶外陽光直射的條件下難以工作,2D攝像頭卻沒有這個(gè)煩惱。

目前,馬克思普朗克計(jì)算機(jī)科學(xué)研究所的科學(xué)家們研發(fā)出了一款只通過單個(gè)普通的2D攝像頭(比如普通智能手機(jī)的攝像頭),就能實(shí)時(shí)捕捉視頻中的3D動(dòng)作的系統(tǒng)。其效果可以媲美多個(gè)攝像頭或者深度攝像頭如Kinect的效果。

使用2D攝像頭獲得3D畫面是科技前沿的開發(fā)者一直在做的事情,我們?cè)啻翁岬竭^,簡(jiǎn)單點(diǎn)說就是通過深度學(xué)習(xí),也就是看得多了就能通過2D畫面得出3D動(dòng)作,例如通過照片就能的出一個(gè)人樣貌的3D畫面。

用2D攝像頭捕捉3D動(dòng)作也是科學(xué)家們一直在做的,其中骨骼姿勢(shì)是其中的一大難題。前人的解決方案中,3D關(guān)節(jié)是十分不穩(wěn)定的,會(huì)發(fā)生嚴(yán)重的偏離,重新投影時(shí)會(huì)不準(zhǔn)確匹配2D位置。即使準(zhǔn)確,也只是在極短的時(shí)間內(nèi),長(zhǎng)時(shí)間下還是不穩(wěn)定的。這導(dǎo)致他們大多數(shù)只能穩(wěn)定捕獲局部3D動(dòng)作,而不是全身。

VNect解決了時(shí)間問題,可以在短時(shí)間內(nèi)骨骼姿勢(shì)穩(wěn)定,同時(shí)還是全身動(dòng)作捕捉。

VNect采用卷積神經(jīng)網(wǎng)絡(luò)(CNN),拋棄了以往的100層設(shè)計(jì),因?yàn)檫\(yùn)算時(shí)間過長(zhǎng),不適合實(shí)時(shí)運(yùn)算,改為更淺的50層。同時(shí)了全新的公式,使得能以高精度輸出,同時(shí)運(yùn)行在30Hz以上。

在CNN的骨骼預(yù)測(cè)當(dāng)中,最重要的骨盆的3D姿勢(shì),他們提出的姿態(tài)公式得出的結(jié)果,吻合度可與世界最先進(jìn)的離線方法媲美。通過組合預(yù)測(cè)2D和3D關(guān)節(jié)位置來確保關(guān)節(jié)的穩(wěn)定,同時(shí)應(yīng)用濾波步驟來確保隨著時(shí)間的推移還能夠平滑的跟蹤,提高了跟蹤姿態(tài)的穩(wěn)定性。

根據(jù)圖片拓展出來了2D熱圖,再捕獲關(guān)節(jié)的相對(duì)位置x、y、z,變?yōu)殛P(guān)節(jié)H。根據(jù)關(guān)節(jié)之間的長(zhǎng)度計(jì)算骨骼的長(zhǎng)度,這將成為預(yù)測(cè)動(dòng)作的重要依據(jù)。采集了通??紤]的17個(gè)關(guān)節(jié),還采取了腳尖的位置。

系統(tǒng)使用的是骨骼的平均數(shù)據(jù),在剛開始的時(shí)候會(huì)有不穩(wěn)定的現(xiàn)象,因?yàn)閱蝹€(gè)攝像頭沒有其他數(shù)據(jù)可以參考,所以需要被跟蹤對(duì)象提供一次身高的數(shù)據(jù),來實(shí)現(xiàn)穩(wěn)定的追蹤。

同時(shí)系統(tǒng)是完全卷積的,可以在目標(biāo)周圍缺少緊湊物的情況下運(yùn)作,并能預(yù)測(cè)不同的場(chǎng)景,這無疑給準(zhǔn)確的測(cè)量提供了堅(jiān)實(shí)的基礎(chǔ)。

在訓(xùn)練時(shí),選擇了八個(gè)項(xiàng)目,五個(gè)與胸同高,2個(gè)與頭同高并向下傾斜,一個(gè)與膝蓋同高并向上傾斜,來學(xué)習(xí)在不同角度下保持穩(wěn)定。同時(shí)采用了多種組合,如背景、衣物(增多衣物)、障礙物(如椅子)等等。

結(jié)果是喜人的,在使用低端手機(jī)的相機(jī)條件下,在3D角色控制、姿態(tài)跟蹤等方面,質(zhì)量與深度攝像頭相當(dāng),例如Xbox上的Kinect(也就是一代和二代,可不是最新的四代)。

在速度上,CNN計(jì)算需要18ms,骨架擬合需要7到10ms,預(yù)處理和過濾需要5ms,最多時(shí)間也只有33ms。

除去前文介紹的優(yōu)勢(shì),該方案還具備深度攝像頭不具備的功能,比如坐在凳子上或其他四肢靠近場(chǎng)景物體時(shí),Kinect發(fā)生明顯錯(cuò)亂,而2D解決方案卻成功了。不過當(dāng)雙腿交叉時(shí),就較為困難了,這將是一個(gè)挑戰(zhàn)。

通過VNect,任何一個(gè)智能手機(jī)都能變成輕量級(jí)的全自動(dòng)手持動(dòng)作捕捉傳感器,這將使許多應(yīng)用變成可能,同時(shí)它還是開源的,可以使更多人參與到開發(fā)當(dāng)中。

不過它也存在著許多不足,VNect腳踝追蹤十分穩(wěn)定,但頭部準(zhǔn)確性十分差。而且單個(gè)2D攝像頭在深度捕捉上嚴(yán)重不足,任何一點(diǎn)細(xì)微的不準(zhǔn)確都可能導(dǎo)致很大的不同。在時(shí)間上也不夠長(zhǎng),長(zhǎng)時(shí)間下追蹤也會(huì)發(fā)生抖動(dòng)。此外,遮擋還是一個(gè)十分嚴(yán)峻的挑戰(zhàn),十分快的運(yùn)動(dòng)也是。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2943

    瀏覽量

    109136
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4797

    瀏覽量

    102321
  • 手機(jī)攝像頭
    +關(guān)注

    關(guān)注

    11

    文章

    60

    瀏覽量

    34659

原文標(biāo)題:開源項(xiàng)目VNect使用普通手機(jī)攝像頭進(jìn)行動(dòng)作捕捉,媲美深度攝像頭

文章出處:【微信號(hào):ARchan_TT,微信公眾號(hào):AR醬】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    專題:3D ToF 技術(shù)大熱,哪些方案值得關(guān)注?

    到的數(shù)據(jù),我們能準(zhǔn)確地知道圖像每個(gè)點(diǎn)離攝像頭的距離,這樣加上該點(diǎn)在2D圖像的(x,y)坐標(biāo),就能獲取圖像
    的頭像 發(fā)表于 07-03 16:32 ?5284次閱讀

    3D掃描的結(jié)構(gòu)光

    光調(diào)制器和幀捕捉速率更高的攝像頭,而亮度更高的圖形照明也會(huì)對(duì)快速掃描有所幫助。在不同的3D測(cè)量系統(tǒng),也許需要從每秒數(shù)次到最高每秒數(shù)百次的圖
    發(fā)表于 08-30 14:51

    怎樣去設(shè)計(jì)種基于OPT9221和OPT8241的3D ToF攝像頭電路?

    3D ToF攝像頭有哪些特性?3D ToF攝像頭有哪些功能?怎樣去設(shè)計(jì)種基于OPT9221和OPT8241的
    發(fā)表于 07-04 07:15

    全球首2D/3D視頻轉(zhuǎn)換實(shí)時(shí)處理芯片:DA8223

      Dialog半導(dǎo)體股份有限公司日前宣布推出全球首2D/3D影像轉(zhuǎn)換實(shí)時(shí)處理芯片:DA8223.該芯片為包括智能手機(jī)和平板電腦等在內(nèi)的各種便攜式設(shè)備提供了
    發(fā)表于 12-14 09:17 ?5344次閱讀

    Xilinx與Xylon聯(lián)合發(fā)布2D/3D環(huán)視系統(tǒng)自動(dòng)多攝像頭圖形拼接IP

    2015年3月6日,中國北京 - All Programmable 技術(shù)和器件的全球領(lǐng)先企業(yè)賽靈思公司(Xilinx, Inc. (NASDAQ:XLNX))攜手Xylon公司今天共同宣布推出最新面向2D/3D環(huán)視
    發(fā)表于 03-06 09:18 ?3666次閱讀

    HTC推出第一款拍攝3D影像雙攝像頭的手機(jī)

    2011 年,HTC 就推出了第一款拍攝 3D 影像雙攝像頭的手機(jī) EVO 3D(G17),隨后HTC 推出了記錄景深數(shù)據(jù),以實(shí)現(xiàn)「先拍照后對(duì)焦」功能雙
    的頭像 發(fā)表于 04-25 16:01 ?9366次閱讀

    對(duì)3D攝像頭和vcesl產(chǎn)業(yè)做個(gè)超詳細(xì)的專業(yè)科普

    電子終端加上了物體感知功能,從而引入多個(gè)“痛點(diǎn)型應(yīng)用場(chǎng)景”,包括人機(jī)交互、人臉識(shí)別、三維建模、AR、安防和輔助駕駛等多個(gè)領(lǐng)域。站在當(dāng)前時(shí)點(diǎn),我們認(rèn)為2D3D攝像頭的轉(zhuǎn)變將成為繼黑白到彩色、低分辨率到
    的頭像 發(fā)表于 02-05 09:35 ?2.6w次閱讀
    對(duì)<b class='flag-5'>3D</b><b class='flag-5'>攝像頭</b>和vcesl產(chǎn)業(yè)做<b class='flag-5'>一</b>個(gè)超詳細(xì)的專業(yè)科普

    MWC2018:奧比光成功研發(fā)手機(jī)3D攝像頭 安卓陣營進(jìn)入3D人臉識(shí)別時(shí)代

    MWC2018正式拉開帷幕,在這次的展會(huì)上,聯(lián)發(fā)科戰(zhàn)略入股,奧比光成功研發(fā)手機(jī)前置3D攝像頭,最新helio P系列芯片平臺(tái)支持奧比3D
    發(fā)表于 03-02 14:49 ?1986次閱讀

    2D3D視頻自動(dòng)轉(zhuǎn)換系統(tǒng)

    完成系統(tǒng)界面的設(shè)置及控制、顯示等功能,其DSP處理器實(shí)現(xiàn)圖像分割和渲染等核心算法,實(shí)現(xiàn)了1個(gè)高效的2D3D視頻視頻轉(zhuǎn)換
    發(fā)表于 03-06 14:20 ?1次下載
    <b class='flag-5'>2D</b>到<b class='flag-5'>3D</b><b class='flag-5'>視頻</b>自動(dòng)轉(zhuǎn)換<b class='flag-5'>系統(tǒng)</b>

    適用于顯示屏的2D多點(diǎn)觸摸與3D手勢(shì)模塊

    視頻將展示結(jié)合多點(diǎn)觸摸與3D手勢(shì)模塊的Microchip顯示解決方案。支持2D/3D功能的顯示屏是Microchip基于GestIC?技術(shù)的最新解決方案。顯示屏上結(jié)合了
    的頭像 發(fā)表于 06-06 02:45 ?5331次閱讀

    華為將推搭載索尼傳感器的3D攝像頭手機(jī)

    華為計(jì)劃推出一款能夠支持3D攝像頭的新手機(jī)。
    的頭像 發(fā)表于 12-11 17:15 ?4691次閱讀

    手機(jī)的雙攝像頭有什么作用

    人的兩眼睛看到的世界是不同的,人腦合成兩眼睛看到的圖像后,就產(chǎn)生了立體感,能判斷出距離、看到繽紛的世界。我們?nèi)粘K吹降恼掌?b class='flag-5'>視頻都是平面的、二維的,是單個(gè)
    的頭像 發(fā)表于 02-01 10:14 ?2w次閱讀

    什么是TOF3D立體攝像頭技術(shù)

    不知道大家是否還記得游戲畫面從2D進(jìn)化到3D時(shí)代的那種感動(dòng)?唯有更加趨近真實(shí)的3D立體“視界”,才能帶給我們最為震撼和沉浸式的體驗(yàn)。如今,手機(jī)攝像頭模塊也正走在從
    的頭像 發(fā)表于 05-20 10:30 ?2.8w次閱讀

    3d人臉識(shí)別和2d人臉識(shí)別的區(qū)別

    首先是3d人臉識(shí)別和2d人臉識(shí)別圖像數(shù)據(jù)獲取不同。3D人臉識(shí)別是以3D攝像頭立體成像,而2D是以
    發(fā)表于 02-05 16:00 ?5w次閱讀

    aikit 2023 3D與機(jī)械臂結(jié)合!

    引言 今天我們主要了解3D攝像頭是如何跟機(jī)械臂應(yīng)用相結(jié)合的。我們最近準(zhǔn)備推出一款新的機(jī)械臂套裝AI Kit 2023 3D,熟悉我們的老用戶應(yīng)該知道,我們之前的AI Kit 2023套
    的頭像 發(fā)表于 11-28 10:38 ?1293次閱讀
    aikit 2023 <b class='flag-5'>3D</b>與機(jī)械臂結(jié)合!