一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

構(gòu)建人形機(jī)器人學(xué)習(xí)的合成運(yùn)動(dòng)生成流程

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2025-04-10 09:36 ? 次閱讀

通用人形機(jī)器人需要能夠快速適應(yīng)現(xiàn)有的以人類為中心的城市和工業(yè)工作空間,處理繁瑣、重復(fù)或體力要求高的任務(wù)。這些移動(dòng)機(jī)器人經(jīng)過設(shè)計(jì),能在以人類為中心的環(huán)境中有出色的表現(xiàn),從工廠車間到醫(yī)療醫(yī)療機(jī)構(gòu),它們的價(jià)值日益凸顯。

模仿學(xué)習(xí)是機(jī)器人學(xué)習(xí)的一個(gè)子集,它能讓人形機(jī)器人通過觀察和模仿人類專家的示范來獲取新技能,這些演示可以來自遠(yuǎn)程操作演示中的人類真實(shí)視頻,也可以來自仿真數(shù)據(jù)。模仿學(xué)習(xí)使用已標(biāo)記的數(shù)據(jù)集,有利于在難以編程定義的不同環(huán)境中教授機(jī)器人復(fù)雜動(dòng)作。

雖然錄制演示可能比指定獎(jiǎng)勵(lì)策略更簡單,但創(chuàng)建完美的演示可能具有挑戰(zhàn)性,并且機(jī)器人可能難以應(yīng)對(duì)一些未曾預(yù)見的情況。在真實(shí)世界中收集廣泛、高質(zhì)量的數(shù)據(jù)集既繁瑣又耗時(shí),而且成本往往高得令人卻步。但是,從物理精確的仿真環(huán)境中生成的合成數(shù)據(jù),有助于加快數(shù)據(jù)收集過程。

用于合成運(yùn)動(dòng)生成的NVIDIA Isaac GR00T Blueprint是基于NVIDIA OmniverseNVIDIA Cosmos構(gòu)建的參考工作流。它從少量的人類演示中創(chuàng)建了大量的合成運(yùn)動(dòng)軌跡,用于機(jī)器人操作。

利用為該藍(lán)圖提供的首批組件,NVIDIA 能夠在短短 11 小時(shí)內(nèi)生成 780,000 個(gè)合成軌跡,相當(dāng)于 6,500 小時(shí)或連續(xù)九個(gè)月的人類演示數(shù)據(jù)。然后,通過將合成數(shù)據(jù)與真實(shí)數(shù)據(jù)相結(jié)合,與僅使用真實(shí)數(shù)據(jù)相比,NVIDIA 將GR00T N1的性能提高了 40%。

在本文中,我們將介紹如何使用空間計(jì)算設(shè)備(例如 Apple Vision Pro)或其他捕獲設(shè)備(例如 space mouse)進(jìn)入仿真機(jī)器人的數(shù)字孿生,并通過遠(yuǎn)程操作仿真機(jī)器人來記錄運(yùn)動(dòng)演示。然后,使用這些記錄生成更大規(guī)模、且物理屬性準(zhǔn)確的合成運(yùn)動(dòng)軌跡集。該藍(lán)圖還可以通過生成數(shù)量呈指數(shù)級(jí)增長、逼真且多樣化的訓(xùn)練數(shù)據(jù)集,進(jìn)一步擴(kuò)充數(shù)據(jù)集。然后,我們使用這些數(shù)據(jù)對(duì)機(jī)器人策略模型進(jìn)行后期訓(xùn)練。

Blueprint 概述

7e2c7cf6-145e-11f0-9310-92fbcf53809c.png

圖 1. NVIDIA Isaac GR00T Blueprint 架構(gòu)

該工作流包括以下關(guān)鍵組成部分:

GR00T-Teleop:即將推出,但目前已經(jīng)可以使用藍(lán)圖中提供的樣本數(shù)據(jù)。

NVIDIA CloudXR Runtime:將Isaac Lab中的仿真?zhèn)鬏數(shù)?Apple Vision Pro,并接收用于人形機(jī)器人遠(yuǎn)程操作的控制數(shù)據(jù)。

適用于 Apple Vision Pro 的 Isaac XR Teleop 示例應(yīng)用:使用戶能夠與從 CloudXR Runtime 流式傳輸?shù)?strong>Isaac Lab仿真進(jìn)行沉浸式交互,并發(fā)送回用于人形機(jī)器人遠(yuǎn)程操作的控制數(shù)據(jù)。

GR00T-Mimic:使用錄制的演示作為輸入,在 Isaac Lab 中生成額外的合成運(yùn)動(dòng)軌跡。此藍(lán)圖的第一版僅適用于單臂操作,支持人形機(jī)器人雙臂操作的版本即將推出。

要錄制您自己的動(dòng)作,請(qǐng)使用空格鼠標(biāo)控件記錄動(dòng)作。更多信息,請(qǐng)參閱生成其他演示:

https://isaac-sim.github.io/IsaacLab/main/source/overview/teleop_imitation.html#generating-additional-demonstrations

GR00T-Gen:通過隨機(jī)化場(chǎng)景中的背景、光照和其他變量來增加多樣性,并通過NVIDIA Cosmos Transfer增強(qiáng)生成的圖像。

Isaac Lab:使用統(tǒng)一的開源機(jī)器人學(xué)習(xí)框架訓(xùn)練機(jī)器人策略。Isaac Lab 基于NVIDIA Isaac Sim構(gòu)建。

7e3f79e6-145e-11f0-9310-92fbcf53809c.png

圖 2. 遠(yuǎn)程操作架構(gòu)

工作流從數(shù)據(jù)采集開始,在這個(gè)過程中,將使用像 Apple Vision Pro 這樣的高保真設(shè)備,在仿真環(huán)境中捕捉人類的動(dòng)作和行為。Apple Vision Pro 將手部追蹤數(shù)據(jù)傳輸?shù)饺?Isaac Lab 等的仿真平臺(tái),同時(shí)仿真平臺(tái)將機(jī)器人環(huán)境的沉浸式視圖傳輸回該設(shè)備。這種設(shè)置使得機(jī)器人操作更加直觀和互動(dòng),有助于收集高質(zhì)量的遠(yuǎn)程操作數(shù)據(jù)。

Isaac Lab 中的機(jī)器人仿真被傳輸?shù)?Apple Vision Pro,讓您能夠可視化機(jī)器人的環(huán)境。通過移動(dòng)手部,您可以直觀地控制機(jī)器人執(zhí)行各種任務(wù)。這種設(shè)置提供了沉浸式且互動(dòng)的遠(yuǎn)程操作體驗(yàn)。

7e5e4ad8-145e-11f0-9310-92fbcf53809c.gif

圖 3. Isaac Lab 中的遠(yuǎn)程操作

使用 GR00T-Mimic

生成合成運(yùn)動(dòng)軌跡

數(shù)據(jù)收集后,下一步是生成合成軌跡。使用 Isaac GR00T-Mimic,能夠從少量人類示范中推算出大量合成運(yùn)動(dòng)軌跡。

這個(gè)過程包括在示范中標(biāo)記關(guān)鍵點(diǎn),并使用插值法確保合成軌跡平滑且符合情境。然后對(duì)生成的數(shù)據(jù)進(jìn)行評(píng)估和優(yōu)化,以滿足訓(xùn)練所需的標(biāo)準(zhǔn)。

在這個(gè)示例中,我們成功生成了 1000 條合成軌跡。

7e7974e8-145e-11f0-9310-92fbcf53809c.gif

圖 4. Isaac Lab 中生成的一組合成軌跡

擴(kuò)充并生成大量數(shù)據(jù)

及多樣化數(shù)據(jù)集

為了縮小仿真與現(xiàn)實(shí)之間的差距,關(guān)鍵是提升合成生成圖像的真實(shí)感,使其達(dá)到必要的逼真度,并通過隨機(jī)化照明、顏色和背景等各種參數(shù)來增加多樣性。

通常,這個(gè)過程需要構(gòu)建逼真的 3D 場(chǎng)景和物體,而且需要耗費(fèi)大量時(shí)間并具備專業(yè)知識(shí)。借助 Cosmos Transfer(WFMs),只需簡單的文本提示,就能大幅加快這一過程,從原本的數(shù)小時(shí)縮短至幾分鐘。

圖 5 和圖 6 的示例,展示了將合成生成的圖像輸入到 NVIDIA Cosmos Transfer WFM 后可實(shí)現(xiàn)的逼真效果。

7ed02482-145e-11f0-9310-92fbcf53809c.gif

圖 5. 在 Isaac Lab 中創(chuàng)建的合成生成圖像

7ee77c36-145e-11f0-9310-92fbcf53809c.gif

圖 6. 借助 NVIDIA Cosmos Transfer WFM 實(shí)現(xiàn)逼真的合成圖像

在 Isaac Lab 中使用

模仿學(xué)習(xí)進(jìn)行訓(xùn)練

最后,通過模仿學(xué)習(xí),利用合成數(shù)據(jù)集對(duì)機(jī)器人進(jìn)行訓(xùn)練。在這個(gè)階段,會(huì)訓(xùn)練一個(gè)策略,比如 Robomimic 套件的循環(huán)高斯混合模型(GMM),以模仿合成數(shù)據(jù)中的動(dòng)作。訓(xùn)練在比如 Isaac Lab 這樣的仿真環(huán)境中進(jìn)行,并且通過多次試驗(yàn)來評(píng)估訓(xùn)練后的策略的性能。

為了展示如何使用這些數(shù)據(jù),我們訓(xùn)練了一臺(tái)帶有夾爪的 Franka 機(jī)器人,在 Isaac Lab 中執(zhí)行堆疊任務(wù)。我們將 Behavioral Cloning 與 Robomimic 套件中的遞歸 GMM 策略結(jié)合使用,該策略使用兩個(gè)隱藏維度為 400 的長短期記憶(LSTM)層。

網(wǎng)絡(luò)的輸入包括機(jī)器人終端執(zhí)行器的位姿、夾爪狀態(tài)以及相對(duì)物體的位姿,而輸出是一個(gè)用于在 Isaac Lab 環(huán)境中驅(qū)動(dòng)機(jī)器人的增量位姿動(dòng)作。

使用由 1000 次成功示范組成的數(shù)據(jù)集,并經(jīng)過 2000 次迭代,我們實(shí)現(xiàn)了大約 50 次迭代 / 秒的訓(xùn)練速度(相當(dāng)于在 NVIDIA RTX GPU 上大約 0.5 小時(shí)的訓(xùn)練時(shí)間)。在 50 次實(shí)驗(yàn)的平均結(jié)果中,經(jīng)過訓(xùn)練的策略在堆棧任務(wù)中的成功率達(dá)到了 84%。

7f485e48-145e-11f0-9310-92fbcf53809c.gif

圖 7. 在 Isaac Lab 中訓(xùn)練的夾爪

工作流的優(yōu)勢(shì)

此方法的主要優(yōu)勢(shì)在于在數(shù)據(jù)收集過程中節(jié)省了時(shí)間,從堆疊立方體到線程針等各種操作任務(wù)的成功率即可證明這一點(diǎn),例如在使用 GPU 和 cuOpt 等技術(shù)時(shí),成功率顯著提高。

7f7c758e-145e-11f0-9310-92fbcf53809c.png

圖 8. 策略模型訓(xùn)練結(jié)果(來源于 MimicGen:利用人類演示實(shí)現(xiàn)可擴(kuò)展機(jī)器人學(xué)習(xí)的數(shù)據(jù)生成系統(tǒng))

傳統(tǒng)上,經(jīng)過適當(dāng)訓(xùn)練的人工操作員大約需要一分鐘來錄制一段高質(zhì)量的示范動(dòng)作,然而由于需要耗費(fèi)大量人力,且存在出錯(cuò)的可能性,這種方式很難大規(guī)模推廣。相比之下,這種新方法通過結(jié)合少量人類演示和合成數(shù)據(jù),能達(dá)到相似的成功率,將數(shù)據(jù)采集時(shí)間從幾小時(shí)縮短到幾分鐘。

通過 NVIDIA Cosmos,您可以增強(qiáng)合成圖像,以實(shí)現(xiàn)所需的逼真度,僅使用文本提示即可有效縮小仿真與現(xiàn)實(shí)之間的差距。這種方法顯著簡化了數(shù)據(jù)收集過程,使您能夠生成多樣化的大型數(shù)據(jù)集,同時(shí)保持或提高生成的機(jī)器人策略的質(zhì)量。

使用該藍(lán)圖的開發(fā)者

智元機(jī)器人、Mentee Robotics、UCR 和 X-Humanoid 等人形機(jī)器人開發(fā)者已將該藍(lán)圖的組件集成到其人形機(jī)器人開發(fā)流程中。

Field AI、Lab0、Miso Robotics、RIVR 和 Sanctuary AI 等其他公司也在利用 Isaac 仿真框架,開發(fā)機(jī)器人大腦和軟件棧,以及測(cè)試和驗(yàn)證物理機(jī)器人。

開始使用

在本文中,我們討論了如何通過 NVIDIA Isaac GR00T 收集、生成和擴(kuò)充訓(xùn)練單臂操作器所需的數(shù)據(jù)。

在 build.nvidia.com 上體驗(yàn)用于合成運(yùn)動(dòng)生成的 NVIDIA Isaac GR00T Blueprint

從 /NVIDIA-Omniverse-blueprints GitHub 代碼庫下載藍(lán)圖,并在您選擇的基礎(chǔ)架構(gòu)上進(jìn)行部署

此藍(lán)圖的第一版僅適用于單臂操作,支持人形機(jī)器人雙臂操作的版本即將推出。

本文最初發(fā)布于 2025 年 1 月,已根據(jù)新的信息進(jìn)行了修改。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5188

    瀏覽量

    105427
  • 仿真
    +關(guān)注

    關(guān)注

    51

    文章

    4212

    瀏覽量

    135056
  • 人形機(jī)器人
    +關(guān)注

    關(guān)注

    4

    文章

    648

    瀏覽量

    17281
  • 數(shù)字孿生
    +關(guān)注

    關(guān)注

    4

    文章

    1424

    瀏覽量

    12676

原文標(biāo)題:構(gòu)建人形機(jī)器人學(xué)習(xí)的合成運(yùn)動(dòng)生成流程

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    《電子發(fā)燒友電子設(shè)計(jì)周報(bào)》聚焦硬科技領(lǐng)域核心價(jià)值 第8期:2025.04.14--2025.04.18

    機(jī)器人領(lǐng)域的應(yīng)用 5、德州儀器的人形機(jī)器人電機(jī)驅(qū)動(dòng)和傳感布局 6、構(gòu)建人形機(jī)器人學(xué)習(xí)
    發(fā)表于 04-18 20:03

    《電子發(fā)燒友電子設(shè)計(jì)周報(bào)》聚焦硬科技領(lǐng)域核心價(jià)值 第9期:2025.04.21--2025.04.25

    設(shè)計(jì) 8、安森美圖像傳感器在機(jī)器人領(lǐng)域的應(yīng)用 9、德州儀器的人形機(jī)器人電機(jī)驅(qū)動(dòng)和傳感布局 10、構(gòu)建人形
    發(fā)表于 04-25 19:15

    【KittenBot機(jī)器人試用申請(qǐng)】KittenBot繪圖避障機(jī)器人學(xué)習(xí)課程

    項(xiàng)目名稱:KittenBot繪圖避障機(jī)器人學(xué)習(xí)課程試用計(jì)劃:1、申請(qǐng)理由:本人為一名高中老師,業(yè)余喜歡學(xué)習(xí)arduino,希望借此機(jī)會(huì)培養(yǎng)學(xué)生的編程能力與動(dòng)手能力2、項(xiàng)目名稱:KittenBot繪圖
    發(fā)表于 07-07 18:05

    【下載】《機(jī)器人學(xué)、機(jī)器視覺與控制――MATLAB算法基礎(chǔ)》

    `內(nèi)容簡介本書是關(guān)于機(jī)器人學(xué)機(jī)器視覺的實(shí)用參考書, 第一部分“基礎(chǔ)知識(shí)”(第2章和第3章)介紹機(jī)器人及其操作對(duì)象的位置和姿態(tài)描述,以及機(jī)器人路徑和
    發(fā)表于 01-17 17:38

    【下載】《機(jī)器人學(xué)、機(jī)器視覺與控制――MATLAB算法基礎(chǔ)》

    `內(nèi)容簡介本書是關(guān)于機(jī)器人學(xué)機(jī)器視覺的實(shí)用參考書, 第一部分“基礎(chǔ)知識(shí)”(第2章和第3章)介紹機(jī)器人及其操作對(duì)象的位置和姿態(tài)描述,以及機(jī)器人路徑和
    發(fā)表于 04-08 18:19

    機(jī)器人基礎(chǔ)書籍

    列舉部分學(xué)習(xí)過程中接觸的部分書籍,部分有中文版,部分有更新版本。1.機(jī)器人基礎(chǔ)書籍適合入門的書籍:機(jī)器人學(xué)機(jī)器人建模規(guī)劃與控制機(jī)器人學(xué)、
    發(fā)表于 05-22 06:53

    機(jī)器人學(xué)習(xí)相關(guān)資料文檔!

    分享八本機(jī)器人方面的文檔,其中包括了算法導(dǎo)論,機(jī)器人學(xué)導(dǎo)論,機(jī)器人技術(shù)及應(yīng)用等多本書籍!喜歡機(jī)器人方面的大家一定不要錯(cuò)過!
    發(fā)表于 08-25 09:46

    已開獎(jiǎng)——【送書福利】機(jī)器人時(shí)代已來!送你幾本機(jī)器人學(xué)硬核好書

    、機(jī)器人學(xué)導(dǎo)論(原書第4版)推薦語:斯坦福大學(xué)機(jī)器人專業(yè)經(jīng)典教材,是當(dāng)今機(jī)器人學(xué)研究領(lǐng)域的經(jīng)典之作。Craig教授將數(shù)學(xué)、力學(xué)和控制論等與機(jī)器人應(yīng)用實(shí)踐密切結(jié)合,對(duì)
    發(fā)表于 11-16 16:14

    機(jī)器人學(xué)

    第一章 緒論 1.1 機(jī)器人學(xué)的發(fā)展1.1.1 機(jī)器人的由來1.1.2 機(jī)器人的定義1.1.3 機(jī)器人學(xué)的進(jìn)展1.2 機(jī)器人的特點(diǎn)、結(jié)構(gòu)與
    發(fā)表于 01-14 16:45 ?99次下載
    <b class='flag-5'>機(jī)器人學(xué)</b>

    機(jī)器人學(xué)_熊有倫

    機(jī)器人學(xué) 熊有倫 1993版 機(jī)器人學(xué) 熊有倫 1993
    發(fā)表于 11-18 17:12 ?0次下載

    機(jī)器人學(xué)習(xí)算法圖解教學(xué)

    本文主要介紹機(jī)器人學(xué)習(xí)算法的編譯及實(shí)際操作
    發(fā)表于 09-14 10:58 ?21次下載

    Google I/O大會(huì):機(jī)器人學(xué)習(xí)系統(tǒng)成主角

    那么機(jī)器人學(xué)習(xí)系統(tǒng)是什么東西呢?首先這個(gè)得提到阿法狗(Alpha Go),AlphaGo的主要工作原理就是“深度學(xué)習(xí)”。簡單來說,只要有經(jīng)驗(yàn)的累積,機(jī)器人學(xué)習(xí)系統(tǒng)將會(huì)越來越精明,越來越懂得使用者的想法。而經(jīng)驗(yàn)主要來源于數(shù)據(jù),恰好
    發(fā)表于 05-14 08:20 ?1183次閱讀

    機(jī)器人學(xué)習(xí)教程之機(jī)器人學(xué)導(dǎo)論電子教程免費(fèi)下載

    本書系統(tǒng)講解了機(jī)器人學(xué)的理論知識(shí),主要內(nèi)容包括:機(jī)器人操作臂的幾何性質(zhì)、引起操作臂運(yùn)動(dòng)的力和力矩、與操作臂機(jī)械設(shè)計(jì)有關(guān)的問題和控制方法、機(jī)器人編程方法等。
    發(fā)表于 12-03 08:00 ?24次下載

    機(jī)器人學(xué)的幾何基礎(chǔ)(教材資料)

    機(jī)器人學(xué)的幾何基礎(chǔ)(第2版)》是一部關(guān)于機(jī)器人學(xué)中有著重要應(yīng)用的幾何概念的精彩導(dǎo)論。第2版提供了對(duì)相關(guān)領(lǐng)域內(nèi)容的深入講解,并仍保持獨(dú)特的風(fēng)格 它的重點(diǎn)不是集中在運(yùn)動(dòng)學(xué)和機(jī)器人學(xué)的計(jì)算結(jié)
    發(fā)表于 04-20 14:43 ?2次下載

    構(gòu)建人形機(jī)器人學(xué)習(xí)合成運(yùn)動(dòng)生成管線

    通用人形機(jī)器人旨在快速適應(yīng)現(xiàn)有的以人類為中心的城市和工業(yè)工作空間,處理繁瑣、重復(fù)或體力要求高的任務(wù)。這些移動(dòng)機(jī)器人經(jīng)過設(shè)計(jì),能在以人類為中心的環(huán)境中有出色的表現(xiàn),從工廠車間到醫(yī)療保健機(jī)構(gòu),它們的價(jià)值日益凸顯。
    的頭像 發(fā)表于 01-16 10:58 ?652次閱讀
    <b class='flag-5'>構(gòu)建</b><b class='flag-5'>人形</b><b class='flag-5'>機(jī)器人學(xué)習(xí)</b>的<b class='flag-5'>合成</b><b class='flag-5'>運(yùn)動(dòng)</b><b class='flag-5'>生成</b>管線