基于MMPose的姿態(tài)估計(jì)配置案例

前言

MMPose是一款基于PyTorch的姿態(tài)分析開(kāi)源工具箱，是OpenMMLab項(xiàng)目成員之一，主要特性：

支持多種人體姿態(tài)分析相關(guān)任務(wù)：2D多人姿態(tài)估計(jì)、2D手部姿態(tài)估計(jì)、動(dòng)物關(guān)鍵點(diǎn)檢測(cè)等等

更高的精度和更快的速度：包括“自頂向下”和“自底向上”兩大類算法

支持多樣的數(shù)據(jù)集：支持了很多主流數(shù)據(jù)集的準(zhǔn)備和構(gòu)建，如 COCO、 MPII等

模塊化設(shè)計(jì)：將統(tǒng)一的人體姿態(tài)分析框架解耦成不同的模塊組件，通過(guò)組合不同的模塊組件，可以便捷地構(gòu)建自定義人體姿態(tài)分析模型

本文主要對(duì)動(dòng)物關(guān)鍵點(diǎn)檢測(cè)模型進(jìn)行微調(diào)與測(cè)試，從數(shù)據(jù)集構(gòu)造開(kāi)始，詳細(xì)解釋各模塊作用。對(duì)一些新手可能會(huì)犯的錯(cuò)誤做一些說(shuō)明

環(huán)境配置

mmcv的安裝方式在我前面的mmdetection和mmsegmentation教程中都有寫(xiě)到。這里不再提

MMPose安裝方法最好是使用git，如果沒(méi)有git工具，可以使用mim install mmpose

最后在項(xiàng)目文件夾下新建checkpoint、outputs、data文件夾，分別用來(lái)存放模型預(yù)訓(xùn)練權(quán)重、模型輸出結(jié)果、訓(xùn)練數(shù)據(jù)

from IPython import display
!pip install openmim
!pip install -q /kaggle/input/frozen-packages-mmdetection/mmcv-2.0.1-cp310-cp310-linux_x86_64.whl


!git clone https://github.com/open-mmlab/mmdetection.git
%cd mmdetection
!pip install -e .


%cd ..
!git clone https://github.com/open-mmlab/mmpose.git
%cd mmpose
!pip install -e .


!mkdir checkpoint
!mkdir outputs
!mkdir data
display.clear_output()

在上面的安裝工作完成后，我們檢查一下環(huán)境，以及核對(duì)一下安裝版本

from IPython import display
import mmcv
from mmcv.ops import get_compiling_cuda_version, get_compiler_version
print('MMCV版本', mmcv.__version__)
%cd /kaggle/working/mmdetection
import mmdet
print('mmdetection版本', mmdet.__version__)
%cd /kaggle/working/mmpose
import mmpose
print('mmpose版本', mmpose.__version__)
print('CUDA版本', get_compiling_cuda_version())
print('編譯器版本', get_compiler_version())

輸出：

MMCV版本 2.0.1
/kaggle/working/mmdetection
mmdetection版本 3.1.0
/kaggle/working/mmpose
mmpose版本 1.1.0
CUDA版本 11.8
編譯器版本 GCC 11.3

?為方便后續(xù)進(jìn)行文件操作，導(dǎo)入一些常用庫(kù)

import os
import io
import json
import shutil
import random
import numpy as np
from pathlib import Path


from PIL import Image
from tqdm import tqdm
from mmengine import Config

from pycocotools.coco import COCO

預(yù)訓(xùn)練模型推理

在進(jìn)行姿態(tài)估計(jì)前需要目標(biāo)檢測(cè)將不同的目標(biāo)檢測(cè)出來(lái)，然后再分別對(duì)不同的目標(biāo)進(jìn)行姿態(tài)估計(jì)。所以我們要選擇一個(gè)目標(biāo)檢測(cè)模型。

這里選擇的是mmdetection工具箱中的RTMDet模型，型號(hào)選擇RTMDet-l。配置文件位于mmdetection/configs/rtmdet/rtmdet_l_8xb32-300e_coco.py，我們復(fù)制模型權(quán)重地址并進(jìn)行下載。

姿態(tài)估計(jì)模型選擇RTMPose模型，打開(kāi)mmpose項(xiàng)目文件夾projects/rtmpose/README.md文檔，發(fā)現(xiàn)RTMPose模型動(dòng)物姿態(tài)估計(jì)（Animal 2d (17 Keypoints)）僅提供了一個(gè)預(yù)訓(xùn)練模型。

配置文件位于projects/rtmpose/rtmpose/animal_2d_keypoint/rtmpose-m_8xb64-210e_ap10k-256x256.py，我們復(fù)制模型權(quán)重地址并進(jìn)行下載。

將預(yù)訓(xùn)練權(quán)重模型全部放入mmpose項(xiàng)目文件夾的checkpoint文件夾下。

# 下載RTMDet-L模型，用于目標(biāo)檢測(cè)
!wget https://download.openmmlab.com/mmdetection/v3.0/rtmdet/rtmdet_l_8xb32-300e_coco/rtmdet_l_8xb32-300e_coco_20220719_112030-5a0be7c4.pth -P checkpoint
# 下載RTMPose模型，用于姿態(tài)估計(jì)
!wget https://download.openmmlab.com/mmpose/v1/projects/rtmposev1/rtmpose-m_simcc-ap10k_pt-aic-coco_210e-256x256-7a041aa1_20230206.pth -P checkpoint
display.clear_output()

MMPose提供了一個(gè)被稱為MMPoseInferencer的、全面的推理API。這個(gè)API使得用戶得以使用所有MMPose支持的模型來(lái)對(duì)圖像和視頻進(jìn)行模型推理。此外，該API可以完成推理結(jié)果自動(dòng)化，并方便用戶保存預(yù)測(cè)結(jié)果。

我們使用Cat Dataset數(shù)據(jù)集中的一張圖片作為示例，進(jìn)行模型推理。推理參數(shù)說(shuō)明：

det_model：mmdetection工具箱中目標(biāo)檢測(cè)模型配置文件

det_weights：mmdetection工具箱中目標(biāo)檢測(cè)模型對(duì)應(yīng)預(yù)訓(xùn)練權(quán)重文件

pose2d：mmpose工具箱中姿態(tài)估計(jì)模型配置文件

pose2d_weights：mmpose工具箱中姿態(tài)估計(jì)對(duì)應(yīng)預(yù)訓(xùn)練權(quán)重文件

out_dir：圖片生成的文件夾

from mmpose.apis import MMPoseInferencer


img_path = '/kaggle/input/cat-dataset/CAT_00/00000001_012.jpg'
# 使用模型別名創(chuàng)建推斷器
inferencer = MMPoseInferencer(det_model = '/kaggle/working/mmdetection/configs/rtmdet/rtmdet_l_8xb32-300e_coco.py',
 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?det_weights = 'checkpoint/rtmdet_l_8xb32-300e_coco_20220719_112030-5a0be7c4.pth',
 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?pose2d = 'projects/rtmpose/rtmpose/animal_2d_keypoint/rtmpose-m_8xb64-210e_ap10k-256x256.py',
 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?pose2d_weights = 'checkpoint/rtmpose-m_simcc-ap10k_pt-aic-coco_210e-256x256-7a041aa1_20230206.pth')


# MMPoseInferencer采用了惰性推斷方法，在給定輸入時(shí)創(chuàng)建一個(gè)預(yù)測(cè)生成器
result_generator = inferencer(img_path, out_dir = 'outputs', show=False)
result = next(result_generator)
display.clear_output()

可視化推理結(jié)果

import matplotlib.pyplot as plt


img_og = mmcv.imread(img_path)
img_fuse = mmcv.imread('outputs/visualizations/00000001_012.jpg')


fig, axes = plt.subplots(1, 2, figsize=(15, 10))
axes[0].imshow(mmcv.bgr2rgb(img_og))
axes[0].set_title('Original Image')
axes[0].axis('off')


axes[1].imshow(mmcv.bgr2rgb(img_fuse))
axes[1].set_title('Keypoint Image')
axes[1].axis('off')
plt.show()

數(shù)據(jù)處理

數(shù)據(jù)內(nèi)容詳解

Cat Dataset包含9000多張貓圖像。對(duì)于每張圖像，都有貓頭部的注釋，有9個(gè)點(diǎn)，2個(gè)用于眼睛，1個(gè)用于嘴巴，6個(gè)用于耳朵。

注釋數(shù)據(jù)存儲(chǔ)在1個(gè)文件中，文件名是相應(yīng)的圖像名稱，末尾加上“cat”。每張貓圖像都有1個(gè)注釋文件。對(duì)于每個(gè)注釋文件，注釋數(shù)據(jù)按以下順序存儲(chǔ)：

?○Number of points （關(guān)鍵點(diǎn)數(shù)目）

?○Left Eye（左眼）

?○Right Eye（右眼）

?○Mouth（嘴）

?○Left Ear-1（左耳-1）

?○Left Ear-2（左耳-2）

?○Left Ear-3（左耳-3）

?○Right Ear-1（右耳-1）

?○Right Ear-2（右耳-2）

?○Right Ear-3（左耳-3）

數(shù)據(jù)集最初在互聯(lián)網(wǎng)檔案館中找到，網(wǎng)站（https://archive.org/details/CAT_DATASET）

數(shù)據(jù)層級(jí)目錄如下所示：

- CAT_00
 ? ? - 00000001_000.jpg
 ? ? - 00000001_000.jpg.cat
 ? ? - 00000001_005.jpg
 ? ? - 00000001_005.jpg.cat
 ? ? - ...
 - CAT_01
 ? ? - 00000100_002.jpg
 ? ? - 00000100_002.jpg.cat
 ? ? - 00000100_003.jpg
 ? ? - 00000100_003.jpg.cat
 - CAT_02
 - CAT_03
 - CAT_04
 - CAT_05
 - CAT_06

總的來(lái)說(shuō)，一共有7個(gè)文件夾，每個(gè)文件夾里面有若干.jpg格式的圖片文件，且對(duì)應(yīng)有.cat格式的注釋文件，.cat文件可以看做是文本文件，內(nèi)容示例：

9 435 322 593 315 524 446 318 285 283 118 430 195 568 186 701 81 703 267?

除第1個(gè)數(shù)字9表示有9個(gè)關(guān)鍵點(diǎn)，后面每2個(gè)點(diǎn)表示1個(gè)部位的坐標(biāo)(x,y)，所以一共有1 + 2 * 9 = 19個(gè)點(diǎn)

文件夾規(guī)整

我們將數(shù)據(jù)集中的7個(gè)文件夾中的圖片與注釋文件分開(kāi)，分別存儲(chǔ)在mmpose項(xiàng)目文件夾data文件夾中，并分別命名為images、ann

def separate_files(og_folder, trans_folder):
 ? ?image_folder = os.path.join(trans_folder, 'images')
 ? ?ann_folder = os.path.join(trans_folder, 'ann')
 ? ?os.makedirs(image_folder, exist_ok=True)
 ? ?os.makedirs(ann_folder, exist_ok=True)
 ? ?for folder in os.listdir(data_folder):
 ? ? ? ?folder_path = os.path.join(data_folder, folder)
 ? ? ? ?if os.path.isdir(folder_path):
 ? ? ? ? ? ?for file in os.listdir(folder_path):
 ? ? ? ? ? ? ? ?if file.endswith('.jpg'):
 ? ? ? ? ? ? ? ? ? ?source_path = os.path.join(folder_path, file)
 ? ? ? ? ? ? ? ? ? ?target_path = os.path.join(image_folder, file)
 ? ? ? ? ? ? ? ? ? ?shutil.copy(source_path, target_path)
 ? ? ? ? ? ? ? ?elif file.endswith('.cat'):
 ? ? ? ? ? ? ? ? ? ?source_path = os.path.join(folder_path, file)
 ? ? ? ? ? ? ? ? ? ?target_path = os.path.join(ann_folder, file)
 ? ? ? ? ? ? ? ? ? ?shutil.copy(source_path, target_path)


data_folder = '/kaggle/input/cat-dataset'
trans_folder = './data'


separate_files(data_folder, trans_folder)

構(gòu)造COCO注釋文件

本質(zhì)上來(lái)說(shuō)COCO就是1個(gè)字典文件，第1級(jí)鍵包含images、annotations、categories。

?○其中images包含id（圖片的唯一標(biāo)識(shí)，必須要是數(shù)值型，不能有字符）、file_name（圖片名字）、?height（圖片高度）,?width（圖片寬度）這些信息

?○其中annotations包含category_id（圖片所屬種類）、segmentation（實(shí)例分割掩碼）、iscrowd（決定是RLE格式還是polygon格式）、image_id（圖片id，對(duì)應(yīng)images鍵中的id）、id（注釋信息id）、bbox（目標(biāo)檢測(cè)框，[x, y, width, height]）、?area（目標(biāo)檢測(cè)框面積）、num_keypoints（關(guān)鍵點(diǎn)數(shù)量）,?keypoints（關(guān)鍵點(diǎn)坐標(biāo)）

?○其中categories包含supercategory、id（類別id）、name（類別名）、keypoints（各部位名稱）、skeleton（部位連接信息）

?○更詳細(xì)的COCO（https://zhuanlan.zhihu.com/p/29393415）注釋文件解析推薦博客COCO數(shù)據(jù)集的標(biāo)注格式、如何將VOC XML文件轉(zhuǎn)化成COCO數(shù)據(jù)格式（https://www.cnblogs.com/marsggbo/p/11152462.html）

?○構(gòu)造read_file_as_list函數(shù)，將注釋文件中的坐標(biāo)變成[x,y,v]，v為0時(shí)表示這個(gè)關(guān)鍵點(diǎn)沒(méi)有標(biāo)注，v為1時(shí)表示這個(gè)關(guān)鍵點(diǎn)標(biāo)注了但是不可見(jiàn)（被遮擋了），v為2時(shí)表示這個(gè)關(guān)鍵點(diǎn)標(biāo)注了同時(shí)可見(jiàn)。因?yàn)閿?shù)據(jù)集中部位坐標(biāo)均標(biāo)注且可見(jiàn)，所以在x,y坐標(biāo)后均插入2。

def read_file_as_list(file_path):
 ? ?with open(file_path, 'r') as file:
 ? ? ? ?content = file.read()
 ? ? ? ?key_point = [int(num) for num in content.split()]
 ? ? ? ?key_num = key_point[0]
 ? ? ? ?key_point.pop(0)
 ? ? ? ?for i in range(2, len(key_point) + len(key_point)//2, 2 + 1):
 ? ? ? ? ? ?key_point.insert(i, 2)
 ? ?return key_num,key_point

構(gòu)造get_image_size函數(shù)，用于獲取圖片寬度和高度。

def get_image_size(image_path):
 ? ?with Image.open(image_path) as img:
 ? ? ? ?width, height = img.size
 ? ?return width, height

因?yàn)閿?shù)據(jù)集沒(méi)有提供目標(biāo)檢測(cè)框信息，且圖片中基本無(wú)干擾元素，所以將目標(biāo)檢測(cè)框信息置為[0, 0, width, height]即整張圖片。相應(yīng)的目標(biāo)檢測(cè)框面積area = width * height。

# 轉(zhuǎn)換為coco數(shù)據(jù)格式
def coco_structure(ann_dir,image_dir):
 ? ?coco = dict()
 ? ?coco['images'] = []
 ? ?coco['annotations'] = []
 ? ?coco['categories'] = []
 ? ?coco['categories'].append(dict(supercategory = 'cat',id = 1,name = 'cat',
 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? keypoints = ['Left Eye','Right Eye','Mouth','Left Ear-1','Left Ear-2','Left Ear-3','Right Ear-1','Right Ear-2','Right Ear-3'],
 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? skeleton = [[0,1],[0,2],[1,2],[3,4],[4,5],[5,6],[6,7],[7,8],[3,8]]))
 ? ?ann_list = os.listdir(ann_dir)
 ? ?id = 0
 ? ?for file_name in tqdm(ann_list):
 ? ? ? ?key_num,key_point = read_file_as_list(os.path.join(ann_dir, file_name))
 ? ? ? ?if key_num == 9:
 ? ? ? ? ? ?image_name = os.path.splitext(file_name)[0]
 ? ? ? ? ? ?image_id = os.path.splitext(image_name)[0]
 ? ? ? ? ? ?height, width = get_image_size(os.path.join(image_dir, image_name))
 ? ? ? ? ? ?image = {"id": id, "file_name": image_name, "height": height, "width": width}
 ? ? ? ? ? ?coco['images'].append(image)
 ? ? ? ? ? ?key_dict = dict(category_id = 1, segmentation = [], iscrowd = 0, image_id = id, 
 ? ? ? ? ? ? ? ? ? ?id = id, bbox = [0, 0, width, height], area = width * height, num_keypoints = key_num, keypoints = key_point)
 ? ? ? ? ? ?coco['annotations'].append(key_dict)
 ? ? ? ? ? ?id = id + 1
 ? ?return coco

寫(xiě)入注釋信息，并將其保存為mmpose項(xiàng)目文件夾data/annotations_all.json文件

ann_file = coco_structure('./data/ann','./data/images')
output_file_path = ?'./data/annotations_all.json'
with open(output_file_path, "w", encoding="utf-8") as output_file:
 ? ?json.dump(ann_file, output_file, ensure_ascii=True, indent=4)

拆分訓(xùn)練、測(cè)試數(shù)據(jù)

按0.85、0.15的比例將注釋文件拆分為訓(xùn)練、測(cè)試文件

def split_coco_dataset(coco_json_path: str, save_dir: str, ratios: list,
 ? ? ? ? ? ? ? ? ? ? ? shuffle: bool, seed: int):
 ? ?if not Path(coco_json_path).exists():
 ? ? ? ?raise FileNotFoundError(f'Can not not found {coco_json_path}')


 ? ?if not Path(save_dir).exists():
 ? ? ? ?Path(save_dir).mkdir(parents=True)


 ? ?ratios = np.array(ratios) / np.array(ratios).sum()


 ? ?if len(ratios) == 2:
 ? ? ? ?ratio_train, ratio_test = ratios
 ? ? ? ?ratio_val = 0
 ? ? ? ?train_type = 'trainval'
 ? ?elif len(ratios) == 3:
 ? ? ? ?ratio_train, ratio_val, ratio_test = ratios
 ? ? ? ?train_type = 'train'
 ? ?else:
 ? ? ? ?raise ValueError('ratios must set 2 or 3 group!')


 ? ?coco = COCO(coco_json_path)
 ? ?coco_image_ids = coco.getImgIds()


 ? ?val_image_num = int(len(coco_image_ids) * ratio_val)
 ? ?test_image_num = int(len(coco_image_ids) * ratio_test)
 ? ?train_image_num = len(coco_image_ids) - val_image_num - test_image_num
 ? ?print('Split info: ====== 
'
 ? ? ? ? ?f'Train ratio = {ratio_train}, number = {train_image_num}
'
 ? ? ? ? ?f'Val ratio = {ratio_val}, number = {val_image_num}
'
 ? ? ? ? ?f'Test ratio = {ratio_test}, number = {test_image_num}')


 ? ?seed = int(seed)
 ? ?if seed != -1:
 ? ? ? ?print(f'Set the global seed: {seed}')
 ? ? ? ?np.random.seed(seed)


 ? ?if shuffle:
 ? ? ? ?print('shuffle dataset.')
 ? ? ? ?random.shuffle(coco_image_ids)


 ? ?train_image_ids = coco_image_ids[:train_image_num]
 ? ?if val_image_num != 0:
 ? ? ? ?val_image_ids = coco_image_ids[train_image_num:train_image_num +
 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? val_image_num]
 ? ?else:
 ? ? ? ?val_image_ids = None
 ? ?test_image_ids = coco_image_ids[train_image_num + val_image_num:]


 ? ?categories = coco.loadCats(coco.getCatIds())
 ? ?for img_id_list in [train_image_ids, val_image_ids, test_image_ids]:
 ? ? ? ?if img_id_list is None:
 ? ? ? ? ? ?continue


 ? ? ? ?img_dict = {
 ? ? ? ? ? ?'images': coco.loadImgs(ids=img_id_list),
 ? ? ? ? ? ?'categories': categories,
 ? ? ? ? ? ?'annotations': coco.loadAnns(coco.getAnnIds(imgIds=img_id_list))
 ? ? ? ?}


 ? ? ? ?if img_id_list == train_image_ids:
 ? ? ? ? ? ?json_file_path = Path(save_dir, f'{train_type}.json')
 ? ? ? ?elif img_id_list == val_image_ids:
 ? ? ? ? ? ?json_file_path = Path(save_dir, 'val.json')
 ? ? ? ?elif img_id_list == test_image_ids:
 ? ? ? ? ? ?json_file_path = Path(save_dir, 'test.json')
 ? ? ? ?else:
 ? ? ? ? ? ?raise ValueError('img_id_list ERROR!')


 ? ? ? ?print(f'Saving json to {json_file_path}')
 ? ? ? ?with open(json_file_path, 'w') as f_json:
 ? ? ? ? ? ?json.dump(img_dict, f_json, ensure_ascii=False, indent=2)


 ? ?print('All done!')

輸出：

loading annotations into memory...
Done (t=0.13s)
creating index...
index created!
Split info: ====== 
Train ratio = 0.85, number = 8495
Val ratio = 0, number = 0
Test ratio = 0.15, number = 1498
Set the global seed: 2023
shuffle dataset.
Saving json to data/trainval.json
Saving json to data/test.json
All done!

可以看到訓(xùn)練集有8495張圖片，測(cè)試集有1498張圖片

模型配置文件

打開(kāi)項(xiàng)目文件夾下的projects/rtmpose/rtmpose/animal_2d_keypoint/rtmpose-m_8xb64-210e_ap10k-256x256.py文件，發(fā)現(xiàn)模型配置文件僅繼承_base_/default_runtime.py文件

需要修改主要有dataset_type、data_mode、dataset_info、codec、train_dataloader 、test_dataloader 、val_evaluator、base_lr、max_epochs、default_hooks。還有一些細(xì)節(jié)我在代碼中有標(biāo)注，可以參照著修改

修改完成后將文件寫(xiě)入./configs/animal_2d_keypoint/cat_keypoint.py中

custom_config = """
_base_ = ['mmpose::_base_/default_runtime.py']


# 數(shù)據(jù)集類型及路徑
dataset_type = 'CocoDataset'
data_mode = 'topdown'
data_root = './data/'
work_dir = './work_dir'


# cat dataset關(guān)鍵點(diǎn)檢測(cè)數(shù)據(jù)集-元數(shù)據(jù)
dataset_info = {
 ? ?'dataset_name':'Keypoint_cat',
 ? ?'classes':'cat',
 ? ?'paper_info':{
 ? ? ? ?'author':'Luck',
 ? ? ? ?'title':'Cat Keypoints Detection',
 ? ?},
 ? ?'keypoint_info':{
 ? ? ? ?0:{'name':'Left Eye','id':0,'color':[255,0,0],'type': '','swap': ''},
 ? ? ? ?1:{'name':'Right Eye','id':1,'color':[255,127,0],'type': '','swap': ''},
 ? ? ? ?2:{'name':'Mouth','id':2,'color':[255,255,0],'type': '','swap': ''},
 ? ? ? ?3:{'name':'Left Ear-1','id':3,'color':[0,255,0],'type': '','swap': ''},
 ? ? ? ?4:{'name':'Left Ear-2','id':4,'color':[0,255,255],'type': '','swap': ''},
 ? ? ? ?5:{'name':'Left Ear-3','id':5,'color':[0,0,255],'type': '','swap': ''},
 ? ? ? ?6:{'name':'Right Ear-1','id':6,'color':[139,0,255],'type': '','swap': ''},
 ? ? ? ?7:{'name':'Right Ear-2','id':7,'color':[255,0,255],'type': '','swap': ''},
 ? ? ? ?8:{'name':'Right Ear-3','id':8,'color':[160,82,45],'type': '','swap': ''}
 ? ?},
 ? ?'skeleton_info': {
 ? ? ? ?0: {'link':('Left Eye','Right Eye'),'id': 0,'color': [255,0,0]},
 ? ? ? ?1: {'link':('Left Eye','Mouth'),'id': 1,'color': [255,0,0]},
 ? ? ? ?2: {'link':('Right Eye','Mouth'),'id': 2,'color': [255,0,0]},
 ? ? ? ?3: {'link':('Left Ear-1','Left Ear-2'),'id': 3,'color': [255,0,0]},
 ? ? ? ?4: {'link':('Left Ear-2','Left Ear-3'),'id': 4,'color': [255,0,0]},
 ? ? ? ?5: {'link':('Left Ear-3','Right Ear-1'),'id': 5,'color': [255,0,0]},
 ? ? ? ?6: {'link':('Right Ear-1','Right Ear-2'),'id': 6,'color': [255,0,0]},
 ? ? ? ?7: {'link':('Right Ear-2','Right Ear-3'),'id': 7,'color': [255,0,0]},
 ? ? ? ?8: {'link':('Left Ear-1','Right Ear-3'),'id': 8,'color': [255,0,0]},
 ? ?}
}


# 獲取關(guān)鍵點(diǎn)個(gè)數(shù)
NUM_KEYPOINTS = len(dataset_info['keypoint_info'])
dataset_info['joint_weights'] = [1.0] * NUM_KEYPOINTS
dataset_info['sigmas'] = [0.025] * NUM_KEYPOINTS


# 訓(xùn)練超參數(shù)
max_epochs = 100 
val_interval = 5
train_cfg = {'max_epochs': max_epochs, 'val_begin':20, 'val_interval': val_interval}
train_batch_size = 32
val_batch_size = 32
stage2_num_epochs = 10
base_lr = 4e-3 / 16
randomness = dict(seed=2023)


# 優(yōu)化器
optim_wrapper = dict(
 ? ?type='OptimWrapper',
 ? ?optimizer=dict(type='AdamW', lr=base_lr, weight_decay=0.05),
 ? ?paramwise_cfg=dict(
 ? ? ? ?norm_decay_mult=0, bias_decay_mult=0, bypass_duplicate=True))


# 學(xué)習(xí)率
param_scheduler = [
 ? ?dict(type='LinearLR', start_factor=1.0e-5, by_epoch=False, begin=0, end=600),
 ? ?dict(
 ? ? ? ?type='CosineAnnealingLR',
 ? ? ? ?eta_min=base_lr * 0.05,
 ? ? ? ?begin=max_epochs // 2,
 ? ? ? ?end=max_epochs,
 ? ? ? ?T_max=max_epochs // 2,
 ? ? ? ?by_epoch=True,
 ? ? ? ?convert_to_iter_based=True),
]


# automatically scaling LR based on the actual training batch size
auto_scale_lr = dict(base_batch_size=1024)


# codec settings
# input_size可以換成128的倍數(shù)
# sigma高斯分布標(biāo)準(zhǔn)差，越大越易學(xué)，但進(jìn)度低。高精度場(chǎng)景，可以調(diào)小，RTMPose 原始論文中為 5.66
# input_size、sigma和下面model中的in_featuremap_size參數(shù)需要成比例縮放
codec = dict(
 ? ?type='SimCCLabel',
 ? ?input_size=(512, 512),
 ? ?sigma=(24, 24),
 ? ?simcc_split_ratio=2.0,
 ? ?normalize=False,
 ? ?use_dark=False)


# 模型：RTMPose-M
model = dict(
 ? ?type='TopdownPoseEstimator',
 ? ?data_preprocessor=dict(
 ? ? ? ?type='PoseDataPreprocessor',
 ? ? ? ?mean=[123.675, 116.28, 103.53],
 ? ? ? ?std=[58.395, 57.12, 57.375],
 ? ? ? ?bgr_to_rgb=True),
 ? ?backbone=dict(
 ? ? ? ?_scope_='mmdet',
 ? ? ? ?type='CSPNeXt',
 ? ? ? ?arch='P5',
 ? ? ? ?expand_ratio=0.5,
 ? ? ? ?deepen_factor=0.67,
 ? ? ? ?widen_factor=0.75,
 ? ? ? ?out_indices=(4, ),
 ? ? ? ?channel_attention=True,
 ? ? ? ?norm_cfg=dict(type='SyncBN'),
 ? ? ? ?act_cfg=dict(type='SiLU'),
 ? ? ? ?init_cfg=dict(
 ? ? ? ? ? ?type='Pretrained',
 ? ? ? ? ? ?prefix='backbone.',
 ? ? ? ? ? ?checkpoint='https://download.openmmlab.com/mmdetection/v3.0/rtmdet/cspnext_rsb_pretrain/cspnext-m_8xb256-rsb-a1-600e_in1k-ecb3bbd9.pth'
 ? ? ? ?)),
 ? ?head=dict(
 ? ? ? ?type='RTMCCHead',
 ? ? ? ?in_channels=768,
 ? ? ? ?out_channels=NUM_KEYPOINTS,
 ? ? ? ?input_size=codec['input_size'],
 ? ? ? ?in_featuremap_size=(16, 16),
 ? ? ? ?simcc_split_ratio=codec['simcc_split_ratio'],
 ? ? ? ?final_layer_kernel_size=7,
 ? ? ? ?gau_cfg=dict(
 ? ? ? ? ? ?hidden_dims=256,
 ? ? ? ? ? ?s=128,
 ? ? ? ? ? ?expansion_factor=2,
 ? ? ? ? ? ?dropout_rate=0.,
 ? ? ? ? ? ?drop_path=0.,
 ? ? ? ? ? ?act_fn='SiLU',
 ? ? ? ? ? ?use_rel_bias=False,
 ? ? ? ? ? ?pos_enc=False),
 ? ? ? ?loss=dict(
 ? ? ? ? ? ?type='KLDiscretLoss',
 ? ? ? ? ? ?use_target_weight=True,
 ? ? ? ? ? ?beta=10.,
 ? ? ? ? ? ?label_softmax=True),
 ? ? ? ?decoder=codec),
 ? ?test_cfg=dict(flip_test=True))


backend_args = dict(backend='local')


# pipelines
train_pipeline = [
 ? ?dict(type='LoadImage', backend_args=backend_args),
 ? ?dict(type='GetBBoxCenterScale'),
 ? ?dict(type='RandomFlip', direction='horizontal'),
 ? ?# dict(type='RandomHalfBody'),
 ? ?dict(
 ? ? ? ?type='RandomBBoxTransform', scale_factor=[0.8, 1.2], rotate_factor=30),
 ? ?dict(type='TopdownAffine', input_size=codec['input_size']),
 ? ?dict(type='mmdet.YOLOXHSVRandomAug'),
 ? ?dict(
 ? ? ? ?type='Albumentation',
 ? ? ? ?transforms=[
 ? ? ? ? ? ?dict(type='ChannelShuffle', p=0.5),
 ? ? ? ? ? ?dict(type='CLAHE', p=0.5),
 ? ? ? ? ? ?# dict(type='Downscale', scale_min=0.7, scale_max=0.9, p=0.2),
 ? ? ? ? ? ?dict(type='ColorJitter', p=0.5),
 ? ? ? ? ? ?dict(
 ? ? ? ? ? ? ? ?type='CoarseDropout',
 ? ? ? ? ? ? ? ?max_holes=4,
 ? ? ? ? ? ? ? ?max_height=0.3,
 ? ? ? ? ? ? ? ?max_width=0.3,
 ? ? ? ? ? ? ? ?min_holes=1,
 ? ? ? ? ? ? ? ?min_height=0.2,
 ? ? ? ? ? ? ? ?min_width=0.2,
 ? ? ? ? ? ? ? ?p=0.5),
 ? ? ? ?]),
 ? ?dict(type='GenerateTarget', encoder=codec),
 ? ?dict(type='PackPoseInputs')
]


val_pipeline = [
 ? ?dict(type='LoadImage', backend_args=backend_args),
 ? ?dict(type='GetBBoxCenterScale'),
 ? ?dict(type='TopdownAffine', input_size=codec['input_size']),
 ? ?dict(type='PackPoseInputs')
]


train_pipeline_stage2 = [
 ? ?dict(type='LoadImage', backend_args=backend_args),
 ? ?dict(type='GetBBoxCenterScale'),
 ? ?dict(type='RandomFlip', direction='horizontal'),
 ? ?dict(type='RandomHalfBody'),
 ? ?dict(
 ? ? ? ?type='RandomBBoxTransform',
 ? ? ? ?shift_factor=0.,
 ? ? ? ?scale_factor=[0.75, 1.25],
 ? ? ? ?rotate_factor=60),
 ? ?dict(type='TopdownAffine', input_size=codec['input_size']),
 ? ?dict(type='mmdet.YOLOXHSVRandomAug'),
 ? ?dict(
 ? ? ? ?type='Albumentation',
 ? ? ? ?transforms=[
 ? ? ? ? ? ?dict(type='Blur', p=0.1),
 ? ? ? ? ? ?dict(type='MedianBlur', p=0.1),
 ? ? ? ? ? ?dict(
 ? ? ? ? ? ? ? ?type='CoarseDropout',
 ? ? ? ? ? ? ? ?max_holes=1,
 ? ? ? ? ? ? ? ?max_height=0.4,
 ? ? ? ? ? ? ? ?max_width=0.4,
 ? ? ? ? ? ? ? ?min_holes=1,
 ? ? ? ? ? ? ? ?min_height=0.2,
 ? ? ? ? ? ? ? ?min_width=0.2,
 ? ? ? ? ? ? ? ?p=0.5),
 ? ? ? ?]),
 ? ?dict(type='GenerateTarget', encoder=codec),
 ? ?dict(type='PackPoseInputs')
]


# data loaders
train_dataloader = dict(
 ? ?batch_size=train_batch_size,
 ? ?num_workers=2,
 ? ?persistent_workers=True,
 ? ?sampler=dict(type='DefaultSampler', shuffle=True),
 ? ?dataset=dict(
 ? ? ? ?type=dataset_type,
 ? ? ? ?data_root=data_root,
 ? ? ? ?metainfo=dataset_info,
 ? ? ? ?data_mode=data_mode,
 ? ? ? ?ann_file='trainval.json',
 ? ? ? ?data_prefix=dict(img='images/'),
 ? ? ? ?pipeline=train_pipeline,
 ? ?))
val_dataloader = dict(
 ? ?batch_size=val_batch_size,
 ? ?num_workers=2,
 ? ?persistent_workers=True,
 ? ?drop_last=False,
 ? ?sampler=dict(type='DefaultSampler', shuffle=False, round_up=False),
 ? ?dataset=dict(
 ? ? ? ?type=dataset_type,
 ? ? ? ?data_root=data_root,
 ? ? ? ?metainfo=dataset_info,
 ? ? ? ?data_mode=data_mode,
 ? ? ? ?ann_file='test.json',
 ? ? ? ?data_prefix=dict(img='images/'),
 ? ? ? ?pipeline=val_pipeline,
 ? ?))
test_dataloader = val_dataloader


default_hooks = {
 ? ?'checkpoint': {'save_best': 'PCK','rule': 'greater','max_keep_ckpts': 2},
 ? ?'logger': {'interval': 50}
}


custom_hooks = [
 ? ?dict(
 ? ? ? ?type='EMAHook',
 ? ? ? ?ema_type='ExpMomentumEMA',
 ? ? ? ?momentum=0.0002,
 ? ? ? ?update_buffers=True,
 ? ? ? ?priority=49),
 ? ?dict(
 ? ? ? ?type='mmdet.PipelineSwitchHook',
 ? ? ? ?switch_epoch=max_epochs - stage2_num_epochs,
 ? ? ? ?switch_pipeline=train_pipeline_stage2)
]


# evaluators
val_evaluator = [
 ? ?dict(type='CocoMetric', ann_file=data_root + 'test.json'),
 ? ?dict(type='PCKAccuracy'),
 ? ?dict(type='AUC'),
 ? ?dict(type='NME', norm_mode='keypoint_distance', keypoint_indices=[0, 1])
]


test_evaluator = val_evaluator
"""
config = './configs/animal_2d_keypoint/cat_keypoint.py'
with io.open(config, 'w', encoding='utf-8') as f:
 ? ?f.write(custom_config)

模型訓(xùn)練

使用訓(xùn)練腳本啟動(dòng)訓(xùn)練

!python tools/train.py {config}

因?yàn)橛?xùn)練輸出太長(zhǎng)，這里截取一段模型在測(cè)試集上最佳精度：

08/06 19:15:56 - mmengine - INFO - Evaluating CocoMetric...
Loading and preparing results...
DONE (t=0.07s)
creating index...
index created!
Running per image evaluation...
Evaluate annotation type *keypoints*
DONE (t=0.57s).
Accumulating evaluation results...
DONE (t=0.03s).
 Average Precision ?(AP) @[ IoU=0.50:0.95 | area= ? all | maxDets= 20 ] = ?0.943
 Average Precision ?(AP) @[ IoU=0.50 ? ? ?| area= ? all | maxDets= 20 ] = ?0.979
 Average Precision ?(AP) @[ IoU=0.75 ? ? ?| area= ? all | maxDets= 20 ] = ?0.969
 Average Precision ?(AP) @[ IoU=0.50:0.95 | area=medium | maxDets= 20 ] = -1.000
 Average Precision ?(AP) @[ IoU=0.50:0.95 | area= large | maxDets= 20 ] = ?0.944
 Average Recall ? ? (AR) @[ IoU=0.50:0.95 | area= ? all | maxDets= 20 ] = ?0.953
 Average Recall ? ? (AR) @[ IoU=0.50 ? ? ?| area= ? all | maxDets= 20 ] = ?0.987
 Average Recall ? ? (AR) @[ IoU=0.75 ? ? ?| area= ? all | maxDets= 20 ] = ?0.977
 Average Recall ? ? (AR) @[ IoU=0.50:0.95 | area=medium | maxDets= 20 ] = -1.000
 Average Recall ? ? (AR) @[ IoU=0.50:0.95 | area= large | maxDets= 20 ] = ?0.953
08/06 19:15:56 - mmengine - INFO - Evaluating PCKAccuracy (normalized by ``"bbox_size"``)...
08/06 19:15:56 - mmengine - INFO - Evaluating AUC...
08/06 19:15:56 - mmengine - INFO - Evaluating NME...
08/06 19:15:57 - mmengine - INFO - Epoch(val) [60][47/47] ? ?coco/AP: 0.943453 ?coco/AP .5: 0.979424 ?coco/AP .75: 0.969202 ?coco/AP (M): -1.000000 ?coco/AP (L): 0.944082 ?coco/AR: 0.953471 ?coco/AR .5: 0.987316 ?coco/AR .75: 0.977303 ?coco/AR (M): -1.000000 ?coco/AR (L): 0.953471 ?PCK: 0.978045 ?AUC: 0.801710 ?NME: 0.121770 ?data_time: 0.101005 ?time: 0.435133
08/06 19:15:57 - mmengine - INFO - The previous best checkpoint /kaggle/working/mmpose/work_dir/best_PCK_epoch_55.pth is removed
08/06 19:16:01 - mmengine - INFO - The best checkpoint with 0.9780 PCK at 60 epoch is saved to best_PCK_epoch_60.pth.

可以看到模型PCK達(dá)到了0.978，AUC達(dá)到了0.8017，mAP也都挺高，說(shuō)明模型效果非常不錯(cuò)！

模型精簡(jiǎn)

mmpose提供模型精簡(jiǎn)腳本，模型訓(xùn)練權(quán)重文件大小減少一半，但不影響精度和推理

將在驗(yàn)證集上表現(xiàn)最好的模型權(quán)重進(jìn)行精簡(jiǎn)

import glob
ckpt_path = glob.glob('./work_dir/best_PCK_*.pth')[0]
ckpt_sim = './work_dir/cat_pose_sim.pth'
# 模型精簡(jiǎn)
!python tools/misc/publish_model.py 
 ? ? ? ?{ckpt_path} 
 ? ? ? ?{ckpt_sim}

模型推理

這里和上面的模型推理使用相同的思路，使用RTMDet模型進(jìn)行目標(biāo)檢測(cè)，使用我們自己訓(xùn)練的RTMPose模型進(jìn)行姿態(tài)估計(jì)。

不過(guò)pose2d參數(shù)是我們上面保存的配置文件./configs/animal_2d_keypoint/cat_keypoint.py，pose2d_weights為最佳精度模型精簡(jiǎn)后的權(quán)重文件glob.glob('./work_dir/cat_pose_sim*.pth')[0]。

img_path = '/kaggle/input/cat-dataset/CAT_00/00000001_012.jpg'


inferencer = MMPoseInferencer(det_model = '/kaggle/working/mmdetection/configs/rtmdet/rtmdet_l_8xb32-300e_coco.py',
 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?det_weights = 'checkpoint/rtmdet_l_8xb32-300e_coco_20220719_112030-5a0be7c4.pth',
 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?pose2d = './configs/animal_2d_keypoint/cat_keypoint.py',
 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?pose2d_weights = glob.glob('./work_dir/cat_pose_sim*.pth')[0])


result_generator = inferencer(img_path, out_dir = 'outputs', show=False)
result = next(result_generator)
display.clear_output()

可視化訓(xùn)練結(jié)果

img_og = mmcv.imread(img_path)
img_fuse = mmcv.imread('outputs/visualizations/00000001_012.jpg')


fig, axes = plt.subplots(1, 2, figsize=(15, 10))
axes[0].imshow(mmcv.bgr2rgb(img_og))
axes[0].set_title('Original Image')
axes[0].axis('off')


axes[1].imshow(mmcv.bgr2rgb(img_fuse))
axes[1].set_title('Keypoint Image')
axes[1].axis('off')
plt.show()

編輯：黃飛

閱讀全文

姿態(tài)估計(jì)(2111) 姿態(tài)估計(jì)(2111)
人體姿態(tài)識(shí)別(1542) 人體姿態(tài)識(shí)別(1542)
pytorch(12788) pytorch(12788)

評(píng)論

相關(guān)推薦

基于PoseDiffusion相機(jī)姿態(tài)估計(jì)方法

介紹一般意義上，相機(jī)姿態(tài)估計(jì)通常依賴于如手工的特征檢測(cè)匹配、RANSAC和束調(diào)整（BA）。在本文中，作者提出了PoseDiffusion，這是一種新穎的相機(jī)姿態(tài)估計(jì)方法，它將深度學(xué)習(xí)與基于對(duì)應(yīng)關(guān)系

2023-07-23 15:22:29

731

姿態(tài)融合算法是什么

作者：Joy Yang1.什么是姿態(tài)融合算法簡(jiǎn)單來(lái)說(shuō)，姿態(tài)融合算法就是融合多種運(yùn)動(dòng)傳感器數(shù)據(jù)（一般需要3軸加速度， 3軸陀螺儀或者3軸地磁感應(yīng)傳感器），通過(guò)數(shù)字濾波算法容錯(cuò)補(bǔ)償，實(shí)現(xiàn)當(dāng)前姿態(tài)檢測(cè)

2019-07-19 06:47:49

姿態(tài)解算算法模塊理解

了解或想開(kāi)發(fā)無(wú)人機(jī)的朋友肯定繞不過(guò)姿態(tài)解算這茬，花點(diǎn)時(shí)間去了解它們?cè)聿⒉浑y，這里提供兩個(gè)原理鏈接供大家參考：四元數(shù)表示旋轉(zhuǎn)的理解四旋翼姿態(tài)解算原理而在代碼實(shí)現(xiàn)方面，我這里寫(xiě)好了姿態(tài)解算算法模塊供大家學(xué)習(xí)和參考。

2022-01-11 07:06:21

AHRS姿態(tài)結(jié)算的yaw不準(zhǔn)確

是這樣的，本人最近在移植ahrs的姿態(tài)結(jié)算，程序是網(wǎng)上的，不過(guò)很奇怪結(jié)算出來(lái)的姿態(tài)pitch，roll 是準(zhǔn)確的，但是yaw不準(zhǔn)確，具體表現(xiàn)為，假如我輕輕轉(zhuǎn)動(dòng)幾度，它算出來(lái)的的yaw角可能要100多度了

2019-05-08 04:51:12

MPU6050姿態(tài)解算的原理是什么

MPU6050姿態(tài)解算的原理是什么？MPU6050姿態(tài)解算的程序該如何去是實(shí)現(xiàn)呢？

2021-12-17 07:14:26

Pixhawk之姿態(tài)解算篇（1）_入門篇（DCM Nomalize）精選資料推薦

一、開(kāi)篇慢慢的、慢慢的、慢慢的就快要到飛控的主要部分了，飛控飛控就是所謂的飛行控制唄，一個(gè)是姿態(tài)解算一個(gè)是姿態(tài)控制，解算是解算，控制是控制，各自負(fù)責(zé)各自的任務(wù)，我也不懂，還在學(xué)習(xí)中~~~~最近看姿態(tài)

2021-08-09 07:23:32

Pixhawk代碼分析-姿態(tài)解算篇A 精選資料推薦

姿態(tài)解算篇A基本知識(shí)1、如何實(shí)現(xiàn)控制一個(gè)無(wú)人機(jī)系統(tǒng)的算法主要有兩類：姿態(tài)檢測(cè)算法、姿態(tài)控制算法。姿態(tài)控制、被控對(duì)象、姿態(tài)檢測(cè)三個(gè)部分構(gòu)成一個(gè)閉環(huán)控制系統(tǒng)。被控對(duì)象的模型是由其物理系統(tǒng)決定，設(shè)計(jì)無(wú)人機(jī)

2021-08-09 08:09:27

【CANNON申請(qǐng)】姿態(tài)解算

申請(qǐng)理由：這款開(kāi)發(fā)板的硬件非常適合我現(xiàn)在在做姿態(tài)解算設(shè)計(jì)，再加上自有的mpu6050 gps，可以用來(lái)測(cè)試姿態(tài)解算的準(zhǔn)確性項(xiàng)目描述：利用陀螺儀，加速度計(jì)，磁力計(jì)等做一個(gè)了定高定位的姿態(tài)解算，檢驗(yàn)算法的正確性

2016-01-26 13:58:39

【HarmonyOS HiSpark AI Camera】運(yùn)動(dòng)身體姿態(tài)分析

項(xiàng)目名稱：運(yùn)動(dòng)身體姿態(tài)分析試用計(jì)劃：項(xiàng)目計(jì)劃通過(guò)攝像頭或傳感器捕獲人體在運(yùn)動(dòng)器械中運(yùn)動(dòng)中的姿態(tài)，通過(guò)AI分析身體狀態(tài)，時(shí)時(shí)對(duì)運(yùn)動(dòng)器械做出相應(yīng)的調(diào)整，對(duì)無(wú)器械運(yùn)動(dòng)對(duì)形體的分析，給出矯正方案預(yù)計(jì)成果捕捉人體的姿態(tài)

2020-11-19 20:48:03

【先楫HPM5361EVK開(kāi)發(fā)板試用體驗(yàn)】06-基于MPU9250的姿態(tài)解算

的姿態(tài)信息，因此需要進(jìn)行姿態(tài)解算以獲取設(shè)備的準(zhǔn)確姿態(tài)。姿態(tài)解算常用的方法有互補(bǔ)濾波和卡爾曼濾波。 1、卡爾曼濾波簡(jiǎn)介卡爾曼濾波是一種利用狀態(tài)估計(jì)和觀測(cè)數(shù)據(jù)的最優(yōu)估計(jì)濾波方法。其優(yōu)點(diǎn)在于能夠處理系統(tǒng)噪聲

2024-01-17 14:55:27

【愛(ài)芯派 Pro 開(kāi)發(fā)板試用體驗(yàn)】人體姿態(tài)估計(jì)模型部署前期準(zhǔn)備

部署模型的整體架構(gòu)。接下來(lái)就回到最開(kāi)始定的主線上了——人體姿態(tài)估計(jì)。這篇文章就是記錄對(duì)一些輕量化人體姿態(tài)估計(jì)模型的調(diào)研，和前期準(zhǔn)備。 1、人體姿態(tài)估計(jì)任務(wù)介紹下面對(duì)人體姿態(tài)估計(jì)任務(wù)做一個(gè)簡(jiǎn)單的介紹

2024-01-01 01:04:09

四軸姿態(tài)解算

mpu6050姿態(tài)解算，內(nèi)部DMP輸出。上位機(jī)為匿名的上位機(jī)。

2015-06-14 17:15:48

基于無(wú)跡卡爾曼濾波的四旋翼無(wú)人飛行器姿態(tài)估計(jì)算法_朱巖

基于無(wú)跡卡爾曼濾波的四旋翼無(wú)人飛行器姿態(tài)估計(jì)算法_朱巖

2020-06-04 08:48:36

嵌入式姿態(tài)測(cè)量系統(tǒng)的姿態(tài)參數(shù)怎么計(jì)算？

傳統(tǒng)的姿態(tài)測(cè)量系統(tǒng)采用捷聯(lián)式慣導(dǎo)系統(tǒng)(SINS)，相比平臺(tái)式慣導(dǎo)系統(tǒng)而言，其具有體積相對(duì)更小，成本相對(duì)更低，易于安裝和維護(hù)并且可靠性更高的有點(diǎn)，因此，捷聯(lián)慣導(dǎo)系統(tǒng)在飛行器導(dǎo)航和姿態(tài)測(cè)量中得到了廣泛

2019-08-22 07:27:31

嵌入式姿態(tài)測(cè)量系統(tǒng)的結(jié)構(gòu)是什么？

傳統(tǒng)的姿態(tài)測(cè)量因?yàn)椴捎酶呔韧勇輧x和加速度計(jì)等姿態(tài)傳感器，體積龐大并且價(jià)格昂貴。當(dāng)前MEMS產(chǎn)品因其體積小、價(jià)格低、功耗低，被稱為是傳統(tǒng)的慣性測(cè)量組合的一次重大改革，越來(lái)越多地應(yīng)用于姿態(tài)測(cè)量應(yīng)用中

2020-04-15 07:12:20

怎樣去設(shè)計(jì)全姿態(tài)指引儀圖形顯示系統(tǒng)？

全姿態(tài)指引儀的功能與原理是什么？怎樣去設(shè)計(jì)全姿態(tài)指引儀圖形顯示系統(tǒng)？

2021-05-07 07:29:02

新手求助如何去設(shè)計(jì)全姿態(tài)指引儀？

全姿態(tài)指引儀的功能與原理是什么？怎樣去設(shè)計(jì)全姿態(tài)指引儀系統(tǒng)的硬件？

2021-05-07 06:01:43

無(wú)人機(jī)設(shè)計(jì)中姿態(tài)檢測(cè)算法、姿態(tài)控制算法有什么區(qū)別 ?

無(wú)人機(jī)設(shè)計(jì)中姿態(tài)檢測(cè)算法、姿態(tài)控制算法有什么區(qū)別 ?推薦課程：張飛四旋翼飛行器視頻套件，76小時(shí)吃透四軸算法http://t.elecfans.com/topic/40.html?elecfans_trackid=bbs_post

2018-07-14 12:12:37

機(jī)器人姿態(tài)監(jiān)控

想弄一個(gè)vi可以動(dòng)態(tài)顯示機(jī)器人的姿態(tài)，但不知道有什么函數(shù)可以引入機(jī)器人的模型，幫幫忙，謝謝。

2012-02-11 17:25:22

蒙特卡羅模擬估計(jì)

[em57]《我國(guó)銀行業(yè)操作風(fēng)險(xiǎn)的蒙特卡羅模擬估計(jì)》樊欣，楊曉光（中國(guó)科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院系統(tǒng)科學(xué)研究所）摘要：利用從公開(kāi)媒體報(bào)道中搜集到的中國(guó)銀行業(yè)操作風(fēng)險(xiǎn)損失事件，分別對(duì)損失事件發(fā)生頻率

2009-03-25 11:50:27

請(qǐng)問(wèn)MPU6050的軟件解算姿態(tài)和DMP解算姿態(tài)各自的優(yōu)缺點(diǎn)是什么？

MPU6050有軟件解算姿態(tài)和DMP解算姿態(tài)，他們各自的優(yōu)缺點(diǎn)是什么呢？因?yàn)榇蠹叶贾赖氖荄MP可以減輕MCU的負(fù)擔(dān)，但我看了好幾個(gè)微型四軸開(kāi)源飛控的選擇都是用軟件解算，什么理由呢？

2019-05-29 04:36:05

請(qǐng)問(wèn)一下end-to-end的人臉姿態(tài)估計(jì)器開(kāi)發(fā)流程有哪些

請(qǐng)問(wèn)一下end-to-end的人臉姿態(tài)估計(jì)器開(kāi)發(fā)流程有哪些？

2022-02-16 07:25:25

請(qǐng)問(wèn)四軸姿態(tài)結(jié)算該怎么學(xué)習(xí)？

有誰(shuí)會(huì)四軸的姿態(tài)結(jié)算嗎?最近要做四軸了，也查了有關(guān)姿態(tài)結(jié)算的資料，但是看的那些資料好難，該怎么學(xué)習(xí)?。壳蟠笊裰?/div>

2019-04-28 05:16:26

陀螺儀姿態(tài)矯正問(wèn)題

目前正在做超聲波測(cè)風(fēng)速風(fēng)向的項(xiàng)目，所測(cè)風(fēng)速風(fēng)向?yàn)樗蕉S面內(nèi)的數(shù)據(jù)，為防止儀器抖動(dòng)偏轉(zhuǎn)造成測(cè)量誤差，現(xiàn)在想用陀螺儀進(jìn)行校準(zhǔn)，陀螺儀測(cè)得的為儀器姿態(tài)角，想通過(guò)姿態(tài)角和坐標(biāo)系轉(zhuǎn)換矩陣，將儀器直接測(cè)得

2019-05-31 04:36:04

光照變化情況下的靜態(tài)頭部姿態(tài)估計(jì)

針對(duì)圖像光照的變化對(duì)靜態(tài)頭部姿態(tài)估計(jì)的影響，該文提出一種基于有向梯度直方圖和主成分分析的姿態(tài)特征，并利用SVM分類器進(jìn)行分類。該算法分別在CMU姿態(tài)、光照、表情數(shù)據(jù)庫(kù)

2009-04-22 09:34:44

基于MEMS的姿態(tài)測(cè)量系統(tǒng)

基于MEMS 的姿態(tài)測(cè)量系統(tǒng)A MEMS2Ba sed Attitude Reference System 載體的姿態(tài)測(cè)量是載體進(jìn)行預(yù)計(jì)軌跡運(yùn)動(dòng)的基礎(chǔ)。姿態(tài)測(cè)量有多種方式,其中采用磁場(chǎng)傳感器測(cè)量大地磁場(chǎng)確定航向的

2009-06-08 20:37:03

衛(wèi)星姿態(tài)測(cè)量系統(tǒng)中模糊神經(jīng)網(wǎng)絡(luò)的應(yīng)用

為了提高衛(wèi)星姿態(tài)測(cè)量系統(tǒng)的姿態(tài)估計(jì)精度，研究設(shè)計(jì)了一個(gè)模糊神經(jīng)網(wǎng)絡(luò)，對(duì)各姿態(tài)傳感器的輸出信號(hào)進(jìn)行綜合處理。研究表明：此方法可以使測(cè)量精度得以很大提高。關(guān)

2009-07-13 11:34:05

飛行體姿態(tài)角測(cè)試技術(shù)

研究飛行體姿態(tài)角測(cè)試技術(shù)，提出了一種姿態(tài)角測(cè)試方法，給出了可行的實(shí)現(xiàn)方案和實(shí)測(cè)曲線，用卡爾丹角結(jié)合測(cè)試曲線對(duì)被測(cè)體姿態(tài)進(jìn)行了分析。通過(guò)實(shí)際測(cè)試，證明了該測(cè)試方

2010-12-23 10:02:51

什么是運(yùn)動(dòng)估計(jì)

什么是運(yùn)動(dòng)估計(jì) 運(yùn)動(dòng)估計(jì)基本思想是將圖像序列的每一幀分成許多互不重疊的宏塊，并認(rèn)為

2008-08-25 13:11:53

3353

微型存儲(chǔ)測(cè)試系統(tǒng)在飛行體姿態(tài)測(cè)量中的設(shè)計(jì)應(yīng)用

　　摘要：本文主要介紹了微型存儲(chǔ)測(cè)試系統(tǒng)在姿態(tài)測(cè)量中的設(shè)計(jì)，結(jié)合飛行體在飛行時(shí)各種變化姿態(tài)的采集，編

2010-11-07 10:54:15

917

[9.2.1]--9.2姿態(tài)估計(jì)(1)

無(wú)人機(jī)

李開(kāi)鴻發(fā)布于 2022-11-10 02:09:00

[9.2.1]--9.2姿態(tài)估計(jì)(2)

無(wú)人機(jī)

李開(kāi)鴻發(fā)布于 2022-11-10 02:10:16

基于姿態(tài)校正的人臉檢測(cè)方法

本人提出了一種基于姿態(tài)校正的人臉檢測(cè)方法，在此基礎(chǔ)上，提出姿態(tài)角度估計(jì)目標(biāo)函數(shù)，并討論了2種尋優(yōu)方法，該方法在自拍的視頻序列中進(jìn)行姿態(tài)估計(jì)和人臉檢測(cè)試驗(yàn)

2011-04-13 17:24:03

基于Kalman濾波的俯仰角速度估計(jì)

直升機(jī)的姿態(tài)角速度不容易準(zhǔn)確獲得，本文提出了一種采用Kalman濾波理論對(duì)直升機(jī)俯仰角速度進(jìn)行估計(jì)的方法，建立俯仰角速度方程，給出估計(jì)參數(shù)的Kalman濾波算法，實(shí)驗(yàn)證明該方法能

2011-06-21 16:37:06

濾波在飛行器姿態(tài)獲取系統(tǒng)中的實(shí)現(xiàn)

濾波在飛行器姿態(tài)獲取系統(tǒng)中的實(shí)現(xiàn)濾波在飛行器姿態(tài)獲取系統(tǒng)中的實(shí)現(xiàn)濾波在飛行器姿態(tài)獲取系統(tǒng)中的實(shí)現(xiàn)

2016-06-08 17:29:36

姿態(tài)解算理解

姿態(tài)解算理解，感興趣的小伙伴們可以瞧一瞧。

2016-08-23 17:56:00

基于磁強(qiáng)計(jì)和MEMS陀螺的彈箭全姿態(tài)探測(cè)

基于磁強(qiáng)計(jì)和MEMS陀螺的彈箭全姿態(tài)探測(cè)

2016-12-17 16:33:39

姿態(tài)控制中的散開(kāi)現(xiàn)象_何朕

姿態(tài)控制中的散開(kāi)現(xiàn)象_何朕

2017-01-08 12:03:28

基于MEMS的捷聯(lián)姿態(tài)系統(tǒng)的設(shè)計(jì)與試驗(yàn)_胡佳興

基于MEMS的捷聯(lián)姿態(tài)系統(tǒng)的設(shè)計(jì)與試驗(yàn)_胡佳興

2017-01-12 20:03:43

仿真姿態(tài)識(shí)別電路原理圖

姿態(tài)識(shí)別電路原理圖

2017-04-25 18:02:04

基于梯度下降法和互補(bǔ)濾波的航向姿態(tài)參考系統(tǒng)

針對(duì)微型無(wú)人機(jī)航向姿態(tài)參考系統(tǒng)低成本、小型化的工程實(shí)現(xiàn)需求，基于三軸陀螺儀、加速度計(jì)和磁力計(jì)，提出了一種在線實(shí)時(shí)姿態(tài)估計(jì)算法。該算法采用四元數(shù)描述系統(tǒng)模型，采用改進(jìn)的梯度下降法預(yù)處理加速度計(jì)和磁力計(jì)

2017-11-16 10:29:24

一種改進(jìn)擴(kuò)展卡爾曼的四旋翼姿態(tài)估計(jì)算法

為了提高標(biāo)準(zhǔn)擴(kuò)展卡爾曼姿態(tài)估計(jì)算法的精確度和快速性，將運(yùn)動(dòng)加速度抑制的動(dòng)態(tài)步長(zhǎng)梯度下降算法融入擴(kuò)展卡爾曼中，提出一種改進(jìn)擴(kuò)展卡爾曼的四旋翼姿態(tài)估計(jì)算法。該算法在卡爾曼測(cè)量更新中采用梯度下降法進(jìn)行

2017-12-04 11:31:26

基于四元數(shù)和擴(kuò)展卡爾曼濾波器的姿態(tài)解算與外力加速度同步估計(jì)算法

針對(duì)慣性導(dǎo)航應(yīng)用中，姿態(tài)解算與外力加速度估計(jì)互相干擾的問(wèn)題，提出一種基于四元數(shù)和擴(kuò)展卡爾曼濾波器的姿態(tài)解算與外力加速度同步估計(jì)算法。首先，利用估計(jì)的外力加速度修正傳感器加速度數(shù)據(jù)得到準(zhǔn)確的反向

2017-12-19 14:11:57

基于STM32的四旋翼飛行姿態(tài)串級(jí)控制的設(shè)計(jì)與實(shí)現(xiàn)

本文主要介紹了基于STM32的四旋翼飛行姿態(tài)串級(jí)控制的設(shè)計(jì)與實(shí)現(xiàn)，行器控制器通過(guò)處理微型MEMS慣性器件和三維地磁傳感器采集的數(shù)據(jù)，計(jì)算飛行器的姿態(tài)角，并根據(jù)飛行指令，結(jié)合相應(yīng)的控制律給出適當(dāng)?shù)目刂菩盘?hào)，控制飛行器姿態(tài)和位置。能夠?qū)崿F(xiàn)飛行姿態(tài)的穩(wěn)定控制，達(dá)到了設(shè)計(jì)的目的。

2017-12-23 15:24:36

7254

基于MPU6050的四軸硬件姿態(tài)解算研究

針對(duì)四軸飛行器姿態(tài)信息的實(shí)時(shí)準(zhǔn)確獲取問(wèn)題，對(duì)四軸飛行器的姿態(tài)解算方面進(jìn)行了研究。在分析姿態(tài)表示的四元數(shù)法和歐拉角法基礎(chǔ)上，以成熟的Mahony互補(bǔ)濾波算法為例比較了軟件姿態(tài)解算和基于MPU6050

2018-03-08 09:19:54

mpu6050姿態(tài)解算原理_mpu6050姿態(tài)解算程序

mpu6050常用作提供飛控運(yùn)行時(shí)的姿態(tài)測(cè)量和計(jì)算。本文首先介紹了MPU6050姿態(tài)解算的原理，其次詳細(xì)的介紹了mpu6050姿態(tài)解算程序。

2018-03-09 09:15:24

41963

一種基于六自由度IMU和動(dòng)力學(xué)的車身姿態(tài)和側(cè)向速度估計(jì)方法

如前文所述，本文建立了三個(gè)估計(jì)器，在小側(cè)向激勵(lì)工況下，可通過(guò)基于動(dòng)力學(xué)模型的估計(jì)器估計(jì)出側(cè)向車速，進(jìn)一步使用該側(cè)向車速估計(jì)出由于平動(dòng)產(chǎn)生的側(cè)向加速度，加速度傳感器測(cè)量值剔除該平動(dòng)加速度后，余下的部分即為由于姿態(tài)角導(dǎo)致的重力在加速度傳感器測(cè)量值中的分量。

2018-07-31 14:26:31

8987

AlphaPose是一個(gè)實(shí)時(shí)多人姿態(tài)估計(jì)系統(tǒng)

新系統(tǒng)采用 PyTorch 框架，在姿態(tài)估計(jì)（Pose Estimation）標(biāo)準(zhǔn)測(cè)試集COCO validation set上，達(dá)到 71mAP的精度（比 OpenPose 相對(duì)提升17

2018-09-08 09:11:05

7987

一種基于深度神經(jīng)網(wǎng)絡(luò)的迭代6D姿態(tài)匹配的新方法

在本文工作中，作者提出了DeepIM——一種基于深度神經(jīng)網(wǎng)絡(luò)的迭代6D姿態(tài)匹配的新方法。給定測(cè)試圖像中目標(biāo)的初始6D姿態(tài)估計(jì)，DeepIM能夠給出相對(duì)SE(3)變換符合目標(biāo)渲染視圖與觀測(cè)圖像之間

2018-09-28 10:23:12

3474

UC Berkeley大學(xué)的研究人員們利用深度姿態(tài)估計(jì)和深度學(xué)習(xí)技術(shù)

給定一段視頻，我們用基于視覺(jué)的動(dòng)作估計(jì)器預(yù)測(cè)每一幀演員的動(dòng)作qt。該動(dòng)作預(yù)測(cè)器是建立在人類網(wǎng)格復(fù)原這一工作之上的（akanazawa.github.io/hmr/），它用弱監(jiān)督對(duì)抗的方法訓(xùn)練動(dòng)作估計(jì)

2018-10-12 09:06:29

2561

針對(duì)姿態(tài)傳感器的姿態(tài)估計(jì)方法的詳細(xì)資料說(shuō)明免費(fèi)下載

針對(duì)姿態(tài)傳感器提供不同采樣率和時(shí)延的矢量測(cè)量離散時(shí)間樣本的情況，提出了一種姿態(tài)估計(jì)方法。所提出的方法基于輸出預(yù)測(cè)器和姿態(tài)觀測(cè)器或?yàn)V波器的級(jí)聯(lián)組合。該預(yù)測(cè)器補(bǔ)償矢量測(cè)量中的采樣和延遲的影響，并提供輸出

2018-12-11 08:00:00

微軟、中科大開(kāi)源基于深度高分辨表示學(xué)習(xí)的姿態(tài)估計(jì)算法

作者在官網(wǎng)指出，深度高分辨率網(wǎng)絡(luò)不僅對(duì)姿態(tài)估計(jì)有效，也可以應(yīng)用到計(jì)算機(jī)視覺(jué)的其他任務(wù)，諸如語(yǔ)義分割、人臉對(duì)齊、目標(biāo)檢測(cè)、圖像分類中，期待更多具有說(shuō)服力的結(jié)果公布。

2019-03-05 09:55:55

2611

一份深度學(xué)習(xí)“人體姿勢(shì)估計(jì)”全指南，從DeepNet到HRNet

一個(gè)部件表示目標(biāo)對(duì)象某部分圖形的模板?！皬椈伞憋@示部件之間的連接方式，當(dāng)部件通過(guò)像素位置和方向進(jìn)行參數(shù)化后，其所得到的結(jié)構(gòu)可以對(duì)與姿態(tài)估計(jì)非常相關(guān)的關(guān)節(jié)進(jìn)行建模。（結(jié)構(gòu)化預(yù)測(cè)任務(wù)）

2019-05-08 17:10:43

15954

基于增強(qiáng)通道和空間信息的人體姿態(tài)估計(jì)網(wǎng)絡(luò)

字節(jié)跳動(dòng)和東南大學(xué)組成的團(tuán)隊(duì)提出了基于增強(qiáng)通道和空間信息的人體姿態(tài)估計(jì)網(wǎng)絡(luò)，論文《Multi-Person Pose Estimation with Enhanced Channel-wise

2019-07-18 11:19:05

3772

姿態(tài)傳感器的工作原理_姿態(tài)傳感器作用

姿態(tài)傳感器是基于MEMS技術(shù)的高性能三維運(yùn)動(dòng)姿態(tài)測(cè)量系統(tǒng)。它包含三軸陀螺儀、三軸加速度計(jì)，三軸電子羅盤等運(yùn)動(dòng)傳感器，通過(guò)內(nèi)嵌的低功耗ARM處理器得到經(jīng) 過(guò)溫度補(bǔ)償?shù)娜S姿態(tài)與方位等數(shù)據(jù)。利用基于四元數(shù)的三維算法和特殊數(shù)據(jù)融合技術(shù)，實(shí)時(shí)輸出以四元數(shù)、歐拉角表示的零漂移三維姿態(tài)方位數(shù)據(jù)。

2019-12-25 10:36:08

17574

騰訊優(yōu)圖實(shí)驗(yàn)室在人體2D姿態(tài)估計(jì)中獲得了創(chuàng)新技術(shù)突破

近日，騰訊優(yōu)圖實(shí)驗(yàn)室在人體2D姿態(tài)估計(jì)任務(wù)中獲得創(chuàng)新性技術(shù)突破，其提出的基于語(yǔ)義對(duì)抗的數(shù)據(jù)增強(qiáng)算法Adversarial Semantic Data Augmentation (ASDA)，刷新

2020-10-26 14:12:42

2357

3D姿態(tài)估計(jì) 時(shí)序卷積+半監(jiān)督訓(xùn)練

在這項(xiàng)工作中，視頻中的3D姿態(tài)可以通過(guò)全卷積模型來(lái)估計(jì)，具體是在二維關(guān)鍵點(diǎn)上通過(guò)空洞時(shí)間卷積的模型得到3D姿態(tài)。我們還介紹了一種不...

2020-12-08 22:54:05

651

一種采用深度殘差網(wǎng)絡(luò)的頭部姿態(tài)估計(jì)方法

為提高真實(shí)場(chǎng)景下頭部姿態(tài)估計(jì)的準(zhǔn)確性，提出一種采用深度殘差網(wǎng)絡(luò)的頭部姿態(tài)估計(jì)方法。將深度殘差網(wǎng)絡(luò) Restnetl01作為主干網(wǎng)絡(luò)，引入優(yōu)化器提高深層卷積網(wǎng)絡(luò)訓(xùn)練時(shí)的梯度穩(wěn)定性，使用RGB圖像并采用

2021-03-16 11:27:44

基于深度學(xué)習(xí)的二維人體姿態(tài)估計(jì)方法

基于深度學(xué)習(xí)的二維人體姿態(tài)估計(jì)方法通過(guò)構(gòu)建特定的神經(jīng)網(wǎng)絡(luò)架構(gòu)，將提取的特征信息根據(jù)相應(yīng)的特征融合方法進(jìn)行信息關(guān)聯(lián)處理，最終獲得人體姿態(tài)估計(jì)結(jié)果，因其具有廣泛的應(yīng)用價(jià)值而受到研究人員的關(guān)注。從數(shù)據(jù)

2021-03-22 15:51:15

硬件Kalman濾波器的航拍云臺(tái)姿態(tài)如何獲取

航拍云臺(tái)姿態(tài)獲取是航空攝影中相機(jī)姿態(tài)校正的基本依據(jù)，介紹了一種基于硬件Kalman濾波器的航拍云臺(tái)姿態(tài)獲取的實(shí)

2021-04-08 15:55:28

2042

收藏！姿態(tài)估計(jì)開(kāi)源項(xiàng)目匯總資料下載

電子發(fā)燒友網(wǎng)為你提供收藏！姿態(tài)估計(jì)開(kāi)源項(xiàng)目匯總資料下載的電子資料下載，更有其他相關(guān)的電路圖、源代碼、課件教程、中文資料、英文資料、參考設(shè)計(jì)、用戶指南、解決方案等資料，希望可以幫助到廣大的電子工程師們。

2021-04-21 08:43:06

基于深度學(xué)習(xí)的二維人體姿態(tài)估計(jì)算法

近年來(lái)人體姿態(tài)估計(jì)作為計(jì)算機(jī)視覺(jué)領(lǐng)域的熱點(diǎn)，在視頻監(jiān)控、人機(jī)交互、智慧校園等領(lǐng)域具有廣泛的應(yīng)用前景。隨著神經(jīng)網(wǎng)絡(luò)的快速發(fā)展，采用深度學(xué)習(xí)方法進(jìn)行二維人體姿態(tài)估計(jì)，相較于傳統(tǒng)需要人工設(shè)定特征的方法

2021-04-27 16:16:07

基于Bagging-SVM集成分類器的頭部姿態(tài)估計(jì)方法

針對(duì)現(xiàn)有常用分類器性能不能滿足頭部姿態(tài)估計(jì)對(duì)準(zhǔn)確率的要求，以及光照變化影響頭部姿態(tài)估計(jì)準(zhǔn)確率的問(wèn)題，提出了一種基于 Bagging-SVM集成分類器的頭部姿態(tài)估計(jì)方法。首先，通過(guò)圖片預(yù)處理

2021-05-07 10:11:14

基于面部特征點(diǎn)定位的圖像人臉姿態(tài)估計(jì)方法

針對(duì)目前基于學(xué)習(xí)的姿態(tài)估計(jì)方法對(duì)訓(xùn)練樣本及設(shè)備要求較高的問(wèn)題，提出一種基于面部特征點(diǎn)定位的無(wú)需訓(xùn)練即能估計(jì)單幅圖像中人臉姿態(tài)的方法。通過(guò) Adrian bulat人臉特征點(diǎn)定

2021-05-24 15:43:38

基于編解碼殘差的人體姿態(tài)估計(jì)方法

人體姿態(tài)估計(jì)尤其是多人姿態(tài)估計(jì)逐漸滲透到教育、體育等各個(gè)方面，精度高、輕量級(jí)的多人姿態(tài)估計(jì)更是當(dāng)下的研究熱點(diǎn)。自下而上的多人姿態(tài)估計(jì)方法的實(shí)時(shí)性較強(qiáng)，但是精度一般不高，網(wǎng)絡(luò)結(jié)構(gòu)也比較龐大。對(duì)于

2021-05-28 16:35:28

基于視點(diǎn)與姿態(tài)估計(jì)的視頻監(jiān)控行人再識(shí)別

行人再識(shí)別是視頻監(jiān)控中一項(xiàng)極具挑戰(zhàn)性的仼務(wù)。圖像中的遮擋、光照、姿態(tài)、視角等因素，會(huì)對(duì)行人再識(shí)別的準(zhǔn)確率造成極大影響。為了提高行人再識(shí)別的準(zhǔn)確率，提出一種融合視點(diǎn)機(jī)制與姿態(tài)估計(jì)的行人再識(shí)別方法。首先

2021-05-28 16:41:15

基于自抗擾解耦模型的四旋翼姿態(tài)控制器

基于自抗擾解耦模型的四旋翼姿態(tài)控制器

2021-07-01 16:28:55

基于單片機(jī)的云臺(tái)姿態(tài)測(cè)量系統(tǒng)設(shè)計(jì)（一）

本課題針對(duì)人們對(duì)安防系統(tǒng)的迫切需求，設(shè)計(jì)一種基于單片機(jī)的云臺(tái)姿態(tài)測(cè)量系統(tǒng)。運(yùn)行該測(cè)量系統(tǒng)后，可以較精確并實(shí)時(shí)獲取云臺(tái)姿態(tài)的數(shù)據(jù)，進(jìn)而為云臺(tái)姿態(tài)控制提供準(zhǔn)確的輸入信息。該技術(shù)方法可以廣泛應(yīng)用

2021-11-18 09:51:03

移動(dòng)和嵌入式人體姿態(tài)估計(jì)

轉(zhuǎn)載自：移動(dòng)和嵌入式人體姿態(tài)估計(jì)(Mobile and Embedded Human Pose Estimation)作者：Arrow背景現(xiàn)有的大部分模型都是在PC(帶有超級(jí)強(qiáng)大...

2022-01-26 18:25:06

人臉姿態(tài)檢測(cè)|Fine Grained Head Pose Estimation Without Keypoint

人臉姿態(tài)估計(jì)算法，主要用以估計(jì)輸入人臉塊的三維歐拉角。一般選取的參考系為相機(jī)坐標(biāo)系，即選擇相機(jī)作為坐標(biāo)原點(diǎn)。姿態(tài)估計(jì)可用于許多...

2022-02-07 11:44:36

如何使用COCO數(shù)據(jù)集訓(xùn)練和優(yōu)化二維姿態(tài)估計(jì)模型

　　PAFs 是一種用自下而上的方法表示關(guān)聯(lián)分?jǐn)?shù)的方法。有關(guān)詳細(xì)信息，請(qǐng)參閱基于部分相似域的實(shí)時(shí)多人二維姿態(tài)估計(jì) 。它由一組二維向量場(chǎng)組成，對(duì)肢體的位置和方向進(jìn)行編碼。這與熱圖相關(guān)聯(lián)，用于在后處理期間通過(guò)執(zhí)行二部匹配和關(guān)聯(lián)身體部位候選來(lái)構(gòu)建骨架。

2022-04-10 09:30:11

2606

用NVIDIA遷移學(xué)習(xí)工具箱如何訓(xùn)練二維姿態(tài)估計(jì)模型

　　本系列的第一篇文章介紹了在 NVIDIA 遷移學(xué)習(xí)工具箱中使用開(kāi)源 COCO 數(shù)據(jù)集和 BodyPoseNet 應(yīng)用程序的如何訓(xùn)練二維姿態(tài)估計(jì)模型。

2022-04-10 09:41:20

1445

深部目標(biāo)姿態(tài)估計(jì)的不確定性量化研究

　　FastUQ 是一種新的用于深部目標(biāo)姿態(tài)估計(jì)的快速不確定性量化方法，具有高效、即插即用的特點(diǎn)，支持一類通用的姿態(tài)估計(jì)任務(wù)。這項(xiàng)研究在自主駕駛和一般自主性方面具有潛在的重大影響，包括更穩(wěn)健和安全的感知，以及不確定性感知控制和規(guī)劃。

2022-04-26 16:18:24

944

iNeRF對(duì)RGB圖像進(jìn)行類別級(jí)別的物體姿態(tài)估計(jì)

NeRF來(lái)應(yīng)用無(wú)網(wǎng)格、純RGB的6DoF姿態(tài)估計(jì)的分析合成法：給定一個(gè)圖像，找到攝像機(jī)相對(duì)于三維物體或場(chǎng)景的平移和旋轉(zhuǎn)。

2022-08-10 11:37:52

1100

基于OnePose的無(wú)CAD模型的物體姿態(tài)估計(jì)

基于CAD模型的物體姿態(tài)估計(jì)：目前最先進(jìn)的物體6DoF姿態(tài)估計(jì)方法可以大致分為回歸和關(guān)鍵點(diǎn)技術(shù)。第一類方法直接將姿勢(shì)參數(shù)與每個(gè)感興趣區(qū)域（RoI）的特征進(jìn)行回歸。相反，后一類方法首先通過(guò)回歸或投票

2022-08-10 11:42:22

1249

一種基于去遮擋和移除的3D交互手姿態(tài)估計(jì)框架

與被充分研究的單手姿態(tài)估計(jì)任務(wù)不同，交互手3D姿態(tài)估計(jì)是近兩年來(lái)剛興起的學(xué)術(shù)方向?，F(xiàn)存的工作會(huì)直接同時(shí)預(yù)測(cè)交互手的左右兩手的姿態(tài)，而我們則另辟蹊徑，將交互手姿態(tài)估計(jì)任務(wù)，解耦成左右兩手分別的單手姿態(tài)估計(jì)任務(wù)。這樣，我們就可以充分利用當(dāng)下單手姿態(tài)估計(jì)技術(shù)的最新進(jìn)展。

2022-09-14 16:30:23

676

將不確定性感知和姿態(tài)回歸結(jié)合用于自動(dòng)駕駛車輛定位

提出了一種聯(lián)合訓(xùn)練姿態(tài)估計(jì)和不確定性的方法，其具有可靠的不確定性估計(jì)和改進(jìn)的訓(xùn)練穩(wěn)定性。

2023-01-30 11:30:28

1193

一種使用2D激光雷達(dá)在室內(nèi)場(chǎng)景下估計(jì)機(jī)器人姿態(tài)的方法

確定移動(dòng)機(jī)器人的狀態(tài)是機(jī)器人導(dǎo)航系統(tǒng)中重要的組成部分。在本文中，我們提出了一種使用2D激光雷達(dá)在室內(nèi)場(chǎng)景下估計(jì)機(jī)器人姿態(tài)的方法，并探討了如何將新型的場(chǎng)景表示模型整合到標(biāo)準(zhǔn)蒙特卡羅定位（MCL）系統(tǒng)中。

2023-02-08 09:46:06

1230

ImPosing：用于視覺(jué)定位的隱式姿態(tài)編碼

先通過(guò)圖像編碼器計(jì)算表示圖像向量。然后通過(guò)評(píng)估分布在地圖上的初始姿態(tài)候選來(lái)搜索相機(jī)姿態(tài)。姿態(tài)編碼器對(duì)相機(jī)姿態(tài)進(jìn)行處理以產(chǎn)生可以與圖像向量相匹配的潛在表示，每個(gè)候選姿態(tài)都會(huì)有一個(gè)基于到相機(jī)姿態(tài)的距離的分?jǐn)?shù)。高分提供了用于選擇新候選者的粗略定位先驗(yàn)。

2023-04-03 09:51:27

320

Meta研究：基于頭顯攝像頭進(jìn)行姿態(tài)估計(jì)的方法和優(yōu)缺點(diǎn)

AR/VR體驗(yàn)需要由用戶姿態(tài)的顯式表征所驅(qū)動(dòng)。特別地，其需要從設(shè)備的角度估計(jì)用戶的姿態(tài)，這隱含地對(duì)應(yīng)于以自我為中心的角度，亦即與用戶3D頭部和身體姿態(tài)相應(yīng)對(duì)的“Egopose/自我姿態(tài)”。自我姿態(tài)驅(qū)動(dòng)著在AR和VR中構(gòu)建自然體驗(yàn)所需的必要輸入。

2023-05-31 14:49:22

450

飛行器姿態(tài)計(jì)算

在飛行器的控制中，姿態(tài)計(jì)算是至關(guān)重要的一步。姿態(tài)計(jì)算的目標(biāo)是確定飛行器相對(duì)于參考坐標(biāo)系的姿態(tài)，通常以歐拉角（滾轉(zhuǎn)、俯仰和偏航）或四元數(shù)的形式表示。

2023-06-14 10:41:40

1253

姿態(tài)傳感器詳解

文章詳細(xì)介紹了姿態(tài)傳感器的硬件設(shè)計(jì)、軟件設(shè)計(jì)和應(yīng)用領(lǐng)域，姿態(tài)傳感器也可以稱為航姿參考系統(tǒng)（AHRS），是如今航模無(wú)人機(jī)，機(jī)器人，天線云臺(tái)，聚光太陽(yáng)能，地面及水下設(shè)備，虛擬現(xiàn)實(shí)，人體運(yùn)動(dòng)分析等需要低成本、高動(dòng)態(tài)三維姿態(tài)測(cè)量的產(chǎn)品設(shè)備等領(lǐng)域常用的一款傳感器。

2022-01-05 14:30:09

2421

九軸姿態(tài)傳感器的介紹和應(yīng)用

姿態(tài)傳感器介紹及應(yīng)用

2021-11-01 10:22:32

1334

硬件加速人體姿態(tài)估計(jì)開(kāi)源分享

電子發(fā)燒友網(wǎng)站提供《硬件加速人體姿態(tài)估計(jì)開(kāi)源分享.zip》資料免費(fèi)下載

2023-06-25 10:27:00

利用opencv+openpose實(shí)現(xiàn)人體姿態(tài)檢測(cè)

利用opencv+openpose實(shí)現(xiàn)，接著我又開(kāi)始找一些資料，在pycharm上部署。前言人體姿態(tài)估計(jì)的一個(gè)有趣應(yīng)用是 CGI（computer graphic image，一種電影制造技術(shù)）應(yīng)用。如果

2023-06-26 10:15:04

2081

AI技術(shù)：一種聯(lián)合迭代匹配和姿態(tài)估計(jì)框架

由于噪聲和退化，并非所有正確匹配都能給出良好的姿態(tài)。之前的操作僅保證具有判別性高的描述子的特征點(diǎn)有更高的匹配分?jǐn)?shù)，并且首先被識(shí)別以參與姿態(tài)估計(jì)，但忽略了魯棒姿態(tài)估計(jì)所需的幾何要求。

2023-07-18 12:58:56

313

AI深度相機(jī)-人體姿態(tài)估計(jì)應(yīng)用

我們非常高興地發(fā)布一個(gè)新的代碼示例，展示虹科AI深度相機(jī)SDK的驚人功能。只需6行源代碼，您就可以實(shí)時(shí)準(zhǔn)確地估計(jì)和跟蹤人體姿態(tài)！我們最新的代碼示例使用AI機(jī)器學(xué)習(xí)技術(shù)來(lái)識(shí)別和跟蹤人體的關(guān)鍵點(diǎn)，使您能

2023-07-31 17:42:26

553

3d人體姿態(tài)估計(jì)用什么實(shí)現(xiàn)的原理為什么要先進(jìn)行2D估計(jì)再進(jìn)行3D估計(jì)？

3D姿態(tài)數(shù)據(jù)集是依靠適合室內(nèi)環(huán)境的動(dòng)作捕捉（MOCAP）系統(tǒng)構(gòu)建的。MOCAP系統(tǒng)需要帶有多個(gè)傳感器和緊身衣褲的復(fù)雜裝置，在室外環(huán)境使用是不切實(shí)際的

2023-08-03 11:40:46

744

基于飛控的姿態(tài)估計(jì)算法作用及原理

? 姿態(tài)估計(jì)的作用？ 姿態(tài)估計(jì)是飛控算法的一個(gè)基礎(chǔ)部分，而且十分重要。為了完成飛行器平穩(wěn)的姿態(tài)控制，首先需要精準(zhǔn)的姿態(tài)數(shù)據(jù)作為控制器的反饋。 ? 飛控姿態(tài)估計(jì)的難點(diǎn)？ 姿態(tài)估計(jì)的一個(gè)難點(diǎn)

2023-11-13 11:00:40

280

一個(gè)用于6D姿態(tài)估計(jì)和跟蹤的統(tǒng)一基礎(chǔ)模型

今天筆者將為大家分享NVIDIA的最新開(kāi)源方案FoundationPose，是一個(gè)用于 6D 姿態(tài)估計(jì)和跟蹤的統(tǒng)一基礎(chǔ)模型。只要給出CAD模型或少量參考圖像，F(xiàn)oundationPose就可以在測(cè)試時(shí)立即應(yīng)用于新物體，無(wú)需任何微調(diào)，關(guān)鍵是各項(xiàng)指標(biāo)明顯優(yōu)于專為每個(gè)任務(wù)設(shè)計(jì)的SOTA方案。

2023-12-19 09:58:19

309

使用愛(ài)芯派Pro開(kāi)發(fā)板部署人體姿態(tài)估計(jì)模型

部署模型的整體架構(gòu)。接下來(lái)就回到最開(kāi)始定的主線上了——人體姿態(tài)估計(jì)。這篇文章就是記錄對(duì)一些輕量化人體姿態(tài)估計(jì)模型的調(diào)研，和前期準(zhǔn)備。

2024-01-09 09:50:44

425

已全部加載完成

搜索歷史

基于MMPose的姿態(tài)估計(jì)配置案例

評(píng)論