一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于TensorFlow的開源JS庫的網(wǎng)頁前端人物動作捕捉的實現(xiàn)

張康康 ? 2019-08-13 20:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:極鏈科技 曾啟澔


前言


隨著前端生態(tài)的發(fā)展,Java已經(jīng)不僅僅局限于作為網(wǎng)頁開發(fā),也越來越活躍于服務(wù)器端,移動端小程序等應(yīng)用開發(fā)中。甚至通過Electron等打包工具,甚至能夠開發(fā)多系統(tǒng)的桌面應(yīng)用。其涉足的領(lǐng)域?qū)挿阂彩沟媚軌驅(qū)崿F(xiàn)的功能也不再是簡單的UI控件制作和內(nèi)容的展示,在互動娛樂,小游戲領(lǐng)域也有著極大的發(fā)展前景。本文以通過Java開發(fā)一個基于瀏覽器攝像頭的實時人物動作捕捉小程序為例,介紹一下前端在這一領(lǐng)域的可行性。

什么是TensorFlow

TensorFlow 最初是由Google大腦小組的研究員和工程師們開發(fā)出來,采用數(shù)據(jù)流圖(Data Flow Graphs)用于機器學(xué)習和深度神經(jīng)網(wǎng)絡(luò)方面數(shù)值計算的開源軟件庫。其高度的可移植性和多語言性使得它可以通過各種常用編程語言編寫,輕松的運行在多種平臺的設(shè)備上。是一個集性能,可靠性,通用性,易用性為一體的強大開源庫。

本文所使用的開源Java模型庫:

l tfjs-models/posenet: 一個機器學(xué)習模型,功能為對圖像或者視頻中的人物進行動作捕捉,輸出人體各個部位的keypoints(坐標集)。具有單一人物分析和多人物分析的特點。

l tfjs-models/body-pix: 一個機器學(xué)習模型,功能為對圖像或者視頻中人物和背景進行分析,將人物從背景中剝離出來,輸出結(jié)果為人體24個部位在畫面中的像素位置。具有將人物與背景分離的功能。

實現(xiàn)原理

本文所介紹的基于瀏覽器和網(wǎng)絡(luò)攝像頭的人物實時動作捕捉方法,其實現(xiàn)原理是通過Java調(diào)用

*在基本的原理中并不是必須的組成部分,但在下文中會簡單介紹一種通過的圖像繪制功能,提升人物捕捉精度的方法。

通過tfjs-models/posenet模型庫實現(xiàn)人物動作捕捉

l基本配置

· 導(dǎo)入JS

7675f2c6ea9e411eb9c9f4a422b25b54.png

· HTML

df7c716bcb814e79b1bb2ce4d48390d3.png

· 初始化網(wǎng)絡(luò)攝像頭

3daaf70911944b1982171be31591868f.png

· 生成posenet對象

1c91cb128c464aa1b19d50ccc7471fdf.png

參數(shù)說明:

architecture:分為MobileNetV1和ResNet50兩個體系,其中ResNet50精度更高但處理速度較慢。

outputStride:輸出結(jié)果每個像素占用字節(jié)數(shù),數(shù)字越小結(jié)果越精確,但處理的成本和時間更多。

inputResolution:輸入圖像壓縮后的尺寸,數(shù)字越大越精確,但處理的成本和時間更多。

multiplier:僅在MobileNetV1體系中使用,卷積運算的深度(通道數(shù)),數(shù)字越大層數(shù)越多越精確,但處理的成本和時間更多。

l執(zhí)行實時分析

2833e7c75f6e4c68a1248417a053378a.png

l結(jié)果

· 多人捕捉:多人捕捉時能夠獲得畫面中人物的keypoints,互相之間有一定的干擾但影響并不是特別大。

· 單人捕捉:很容易被背景及身邊人物干擾,導(dǎo)致人體keypoint定位不準確。

l缺點

通過實際的效果可以看到,該模型可以在多人物的時候準確捕捉到各個人物的動作和身體部位的keypoints,雖然存在若干干擾和不穩(wěn)定但基本能夠接受,實時性效果好,但是無法區(qū)分主要人物和次要人物,需要開發(fā)者對結(jié)果數(shù)據(jù)進行處理。

其score的生成是根據(jù)形狀準確度來計算,沒有場景深度的分析,因此無法判斷人物前后位置關(guān)系。

由于以上的問題,該方法在單一人物動作捕捉時被周圍環(huán)境干擾的影響極大。在背景存在其他人物時會因無法判斷主次人物關(guān)系,極大的降低準確率。對單一人物動作捕效果非常的不理想,需要進行改進。

改進方案

單一人物的動作捕捉被外界干擾的影響太大導(dǎo)致結(jié)果并不理想,因此首先要考慮的就是屏蔽掉周圍干擾物體,突出主體人物。由此引入了tfjs-models/body-pix模型庫。

**tfjs-models/body-pix模型庫的主要功能:**實時分析人物結(jié)構(gòu),將人物從背景中剝離。其作用對象為單一捕捉對象,正好適用于上述單人捕捉結(jié)果不理想的情況。

l基本配置

· 導(dǎo)入JS

f97f879121b0461b9654597f91a20dd5.png

· 生成bodyPixNet對象

dca1c4f005984c13b5dc878a7d3c88bd.png

ltfjs-models/body-pix與tfjs-models/posenet的混合使用

298fe16954534859a253e6fb7c148c89.png

l結(jié)果

tfjs-models/body-pix與tfjs-models/posenet的混合使用,雖然加大了canvas處理的負擔,加大了描繪和圖像處理的次數(shù),但是由于tfjs-models/body-pix已經(jīng)先將人物與背景剝離,在tfjs-models/posenet只使用用最高效但低準確度的參數(shù)配置下,也能夠產(chǎn)生遠高于使用高精確度但消耗處理性能極大的配置所不能達到的準確度。從而實現(xiàn)了高效,高準確度,流暢的實時單人動作捕捉功能。

結(jié)論

通過TensorFlow的開源庫,能夠輕松的在瀏覽器上通過網(wǎng)絡(luò)攝像頭實現(xiàn)人物動作的實時捕捉。

由于基于圖像分析,因此表現(xiàn)能力極大的依賴于對canvas的描繪性能,移動端由于瀏覽器canvas描繪能力以及硬件性能限制的原因,表現(xiàn)并不出色,無法做到長時間實時捕捉。甚至部分瀏覽器限制了網(wǎng)絡(luò)攝像頭的調(diào)用。在移動端的表現(xiàn)并不出色。

在單一人物的動作捕捉時,tfjs-models/body-pix與tfjs-models/posenet的混合使用能夠使精確度大大提升。

由于需要對canvas進行描繪,結(jié)合其他canvas的JS庫可以進行交互UI,交互小游戲等不同場合APP的開發(fā)。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    用樹莓派搞深度學(xué)習?TensorFlow啟動!

    介紹本頁面將指導(dǎo)您在搭載64位Bullseye操作系統(tǒng)的RaspberryPi4上安裝TensorFlow。TensorFlow是一個專為深度學(xué)習開發(fā)的大型軟件,它消耗大量資源。您可以在
    的頭像 發(fā)表于 03-25 09:33 ?440次閱讀
    用樹莓派搞深度學(xué)習?<b class='flag-5'>TensorFlow</b>啟動!

    摩爾線程完成DeepSeek開源FlashMLA和DeepGEMM適配

    自DeepSeek啟動“開源周”以來,已陸續(xù)開源三個代碼。摩爾線程基于全新MUSA Compute Capability 3.1計算架構(gòu),可提供原生FP8計算能力,同時升級了高性能線性代數(shù)模板
    的頭像 發(fā)表于 02-27 14:40 ?563次閱讀

    沐曦GPU跑通DeepSeek開源代碼FlashMLA

    今日,DeepSeek正式啟動"開源周"計劃,首發(fā)代碼FlashMLA一經(jīng)開源即引發(fā)全網(wǎng)關(guān)注。截至發(fā)稿,該項目已在GitHub斬獲超7.2K Star!
    的頭像 發(fā)表于 02-25 16:25 ?871次閱讀

    AI開源模型有什么用

    AI開源模型作為推動AI技術(shù)發(fā)展的重要力量,正深刻改變著我們的生產(chǎn)生活方式。接下來,AI部落小編帶您了解AI開源模型有什么用。
    的頭像 發(fā)表于 02-24 11:50 ?430次閱讀

    Bun 1.2震撼發(fā)布:全力挑戰(zhàn)Node.js生態(tài)的JavaScript運行時新星

    了與 Node.js 的兼容性,還為開發(fā)者帶來了內(nèi)置的數(shù)據(jù)支持和云服務(wù)集成能力,進一步強化了其“全能工具包”的定位。Node.js 兼容性獲得突破性進展在此次更新中,最引人注目的是 Bun 在 Node.
    的頭像 發(fā)表于 01-24 10:42 ?852次閱讀
    Bun 1.2震撼發(fā)布:全力挑戰(zhàn)Node.<b class='flag-5'>js</b>生態(tài)的JavaScript運行時新星

    SciChart—高性能的JavaScript圖表和圖形

    使用 SciChart 的 JavaScript 圖表為您的 JS 應(yīng)用程序發(fā)現(xiàn)終極解決方案。 使用 WebGL 創(chuàng)建動態(tài)、高速的圖表和圖形,非常適合實時處理復(fù)雜的數(shù)據(jù)可視化。使用我們強大而靈活
    的頭像 發(fā)表于 01-22 10:15 ?728次閱讀
    SciChart—高性能的JavaScript圖表和圖形<b class='flag-5'>庫</b>

    前端性能優(yōu)化:提升用戶體驗的關(guān)鍵策略

    在互聯(lián)網(wǎng)飛速發(fā)展的今天,用戶對于網(wǎng)頁的加載速度和響應(yīng)性能要求越來越高。前端性能優(yōu)化成為了提升用戶體驗、增強網(wǎng)站競爭力的關(guān)鍵策略。一個性能良好的前端應(yīng)用,能夠快速響應(yīng)用戶的操作,減少等待時間,為用戶
    的頭像 發(fā)表于 01-22 10:08 ?482次閱讀

    前端技術(shù)的未來趨勢:擁抱創(chuàng)新,塑造無限可能

    為未來的重要趨勢之一。智能交互將變得更加自然和流暢。例如,通過語音識別和自然語言處理技術(shù),用戶可以直接通過語音指令與網(wǎng)頁進行交互,實現(xiàn)更加便捷的操作。智能聊天機器人將在網(wǎng)頁中得到更廣泛的應(yīng)用,為用戶提供實時
    的頭像 發(fā)表于 01-22 10:07 ?442次閱讀

    開源AI模型是干嘛的

    開源AI模型是指那些公開源代碼、允許自由訪問和使用的AI模型集合。這些模型通常經(jīng)過訓(xùn)練,能夠執(zhí)行特定的任務(wù)。以下,是對開源AI模型的詳細
    的頭像 發(fā)表于 12-14 10:33 ?789次閱讀

    Node.js小科普和Node.js安裝常見管理工具

    Node.js是一個JavaScript的運行環(huán)境,用來執(zhí)行JavaScript代碼。 為什么會出現(xiàn)這么一個運行環(huán)境呢,從JavaScript研發(fā)初衷可以看出它是為了運行在瀏覽器中的,讓網(wǎng)頁交互更加
    的頭像 發(fā)表于 11-23 15:37 ?418次閱讀
    Node.<b class='flag-5'>js</b>小科普和Node.<b class='flag-5'>js</b>安裝常見管理工具

    前端技術(shù)探秘-Nodejs的CommonJS規(guī)范實現(xiàn)原理

    了解Node.js Node.js是一個基于ChromeV8引擎的JavaScript運行環(huán)境,使用了一個事件驅(qū)動、非阻塞式I/O模型,讓JavaScript 運行在服務(wù)端的開發(fā)平臺,它讓
    的頭像 發(fā)表于 11-05 11:56 ?1195次閱讀
    <b class='flag-5'>前端</b>技術(shù)探秘-Nodejs的CommonJS規(guī)范<b class='flag-5'>實現(xiàn)</b>原理

    PNI高精度低功耗3D動作捕捉手柄方案

    SpacePoint3D動作捕捉手柄方案被虛擬現(xiàn)實(VR)廠商PICO選入PICOTrackingkit產(chǎn)品。虛擬現(xiàn)實和游戲類手柄的設(shè)計師們非常清楚地了解,用消費類慣性傳感器想做到高精準度的動作
    的頭像 發(fā)表于 11-05 08:06 ?460次閱讀
    PNI高精度低功耗3D<b class='flag-5'>動作</b><b class='flag-5'>捕捉</b>手柄方案

    分享一個嵌入式通用FIFO環(huán)形緩沖區(qū)實現(xiàn)

    開源項目ringbuff ,是一款通用FIFO環(huán)形緩沖區(qū)實現(xiàn)開源,作者MaJerle,遵循 MIT 開源許可協(xié)議。
    的頭像 發(fā)表于 10-23 16:20 ?1173次閱讀
    分享一個嵌入式通用FIFO環(huán)形緩沖區(qū)<b class='flag-5'>實現(xiàn)</b><b class='flag-5'>庫</b>

    鴻蒙跨端實踐-JS虛擬機架構(gòu)實現(xiàn)

    類似的框架,我們需要自行實現(xiàn)以確保核心基礎(chǔ)能力的完整。 鴻蒙虛擬機的開發(fā)經(jīng)歷了從最初 ArkTs2V8 到 JSVM + Roma新架構(gòu)方案 。在此過程中,我們實現(xiàn)了完整的鴻蒙版的“J2V8”和 基于系統(tǒng)JSVM的JS虛擬機框架
    的頭像 發(fā)表于 09-30 14:42 ?3004次閱讀
    鴻蒙跨端實踐-<b class='flag-5'>JS</b>虛擬機架構(gòu)<b class='flag-5'>實現(xiàn)</b>

    第四章:在 PC 交叉編譯 aarch64 的 tensorflow 開發(fā)環(huán)境并測試

    本文介紹了在 PC 端交叉編譯 aarch64 平臺的 tensorflow 而非 tensorflow lite 的心酸過程。
    的頭像 發(fā)表于 08-25 11:38 ?2611次閱讀
    第四章:在 PC 交叉編譯 aarch64 的 <b class='flag-5'>tensorflow</b> 開發(fā)環(huán)境并測試