這篇文章是“NVIDIA 機(jī)器人研究與開發(fā)摘要 (R2D2)”的一部分,旨在讓開發(fā)者更深入地了解 NVIDIA 研究中心在物理 AI 和機(jī)器人應(yīng)用方面的最新突破。
本期 NVIDIA 機(jī)器人研究與開發(fā)摘要 (R2D2) 將探討 NVIDIA 研究中心針對機(jī)器人裝配任務(wù)的多種接觸密集型操作工作流,以及它們?nèi)绾谓鉀Q傳統(tǒng)固定自動化在魯棒性、適應(yīng)性和可擴(kuò)展性等方面的關(guān)鍵挑戰(zhàn)。
什么是接觸密集型操作?
接觸密集型操作是指機(jī)器人與環(huán)境中的物體進(jìn)行持續(xù)或重復(fù)物理接觸的任務(wù),需要精確控制力和運(yùn)動。與簡單的抓取和放置操作不同,這些任務(wù)需要精細(xì)的交互來處理不確定性下的摩擦、順應(yīng)性和對齊問題。
接觸密集型操作在機(jī)器人、制造和汽車等行業(yè)中起著關(guān)鍵作用,常見任務(wù)包括插入銷釘、嚙合齒輪、旋緊螺栓以及組裝卡扣零件。作為機(jī)器人裝配的核心能力之一,接觸密集型操作使機(jī)器人能夠執(zhí)行復(fù)雜的高精度任務(wù),這對于自動化裝配和應(yīng)對真實(shí)世界的多樣化變化至關(guān)重要。
NVIDIA 研究中心應(yīng)對
機(jī)器人裝配任務(wù)的工作流
由于需要在動態(tài)環(huán)境中進(jìn)行精確操作,機(jī)器人裝配一直是極具挑戰(zhàn)性的課題。傳統(tǒng)的機(jī)器人裝配依賴固定自動化,靈活性受限。然而隨著 AI、機(jī)器學(xué)習(xí)和機(jī)器人仿真技術(shù)的進(jìn)步,機(jī)器人能夠處理更復(fù)雜的任務(wù)。NVIDIA 研究中心開發(fā)的以下一系列裝配工作流,標(biāo)志著從剛性自動化向靈活、可擴(kuò)展的機(jī)器人系統(tǒng)的轉(zhuǎn)變:
Factory:基于物理的快速仿真與學(xué)習(xí)工具包,用于實(shí)時(shí)接觸密集型交互。
IndustReal:使機(jī)器人能夠通過強(qiáng)化學(xué)習(xí)在仿真中學(xué)習(xí)裝配任務(wù),并將其遷移到真實(shí)世界的一套算法和系統(tǒng)工具包。
AutoMate:用于在不同幾何形狀的裝配任務(wù)中訓(xùn)練專用和通用機(jī)器人裝配策略的全新策略學(xué)習(xí)框架。
MatchMaker:使用生成式 AI 自動生成多樣化、可用于仿真的裝配資產(chǎn)對的全新流程。
SRSA:從現(xiàn)有技能中進(jìn)行檢索,用以對新的機(jī)器人裝配任務(wù)進(jìn)行微調(diào)的框架。
TacSL:基于 GPU 的視觸覺傳感器仿真與學(xué)習(xí)庫。
FORGE:利用力測量作為輸入,實(shí)現(xiàn)零樣本仿真到現(xiàn)實(shí)遷移的強(qiáng)化學(xué)習(xí)策略框架。
機(jī)器人裝配的基礎(chǔ)性突破:
Factory、IndustReal 和 AutoMate
長期以來,接觸密集型交互的實(shí)時(shí)仿真一直被視為計(jì)算上難以實(shí)現(xiàn)的難題,但是 Factory 實(shí)現(xiàn)了突破。Factory 是一個(gè)基于 GPU 的仿真框架,使用 SDF 碰撞、接觸簡化和 Gauss-Seidel 求解器。
NVIDIA Isaac Lab 中已經(jīng)可以提供這些環(huán)境,如圖 1 所示。在此基礎(chǔ)上,在仿真感知策略更新、基于 SDF 的獎勵(lì)、基于采樣的課程和策略級動作整合器等創(chuàng)新的推動下,IndustReal 的發(fā)布實(shí)現(xiàn)了裝配技能從仿真到現(xiàn)實(shí)世界的零樣本遷移,在 600 次試驗(yàn)中成功率達(dá) 83% 至 99%。這項(xiàng)技術(shù)已經(jīng)在 Franka Panda 和 UR10e 機(jī)器人上進(jìn)行了測試,為現(xiàn)實(shí)工業(yè)應(yīng)用鋪平了道路。
圖 1. Isaac Lab 中的接觸密集型仿真環(huán)境
AutoMate 進(jìn)一步推動了這項(xiàng)技術(shù)的發(fā)展。通過引入首個(gè)基于仿真的框架,將強(qiáng)化學(xué)習(xí)與模仿學(xué)習(xí)相結(jié)合,解決了廣泛的挑戰(zhàn)性裝配任務(wù),實(shí)現(xiàn)了大規(guī)模的零樣本仿真到現(xiàn)實(shí)的遷移。它提供了 100 個(gè)仿真兼容的裝配資產(chǎn)、解決約 80 項(xiàng)任務(wù)的專用策略,以及通過蒸餾和微調(diào)訓(xùn)練可處理 20 項(xiàng)任務(wù)的通用策略(成功率均達(dá)到約 80%)。
值得注意的是,這兩種策略類型均展示了零樣本仿真到現(xiàn)實(shí)遷移的能力,有時(shí)甚至超過了仿真性能。如圖 2 所示,AutoMate 經(jīng)過超過 500 萬次仿真試驗(yàn)和 500 次真實(shí)試驗(yàn)的評估。專用策略通過拆卸實(shí)現(xiàn)裝配 (assembly-by-disassembly)、強(qiáng)化學(xué)習(xí)與模仿學(xué)習(xí)、以及 Dynamic Time Warping (DTW) 的組合進(jìn)行訓(xùn)練。通用策略使用 PointNet 自動編碼器進(jìn)行幾何表示,從專用策略中提取知識,并基于強(qiáng)化學(xué)習(xí)進(jìn)行微調(diào)。
圖 2. 在仿真和真實(shí)世界中部署的 AutoMate 策略,每個(gè)示例上方顯示唯一的裝配 ID
借助先進(jìn)學(xué)習(xí)算法和自動化,
探索機(jī)器人裝配領(lǐng)域的邊界
在 Factory 和 IndustReal 突破性成果的基礎(chǔ)上,研究團(tuán)隊(duì)利用自動化資產(chǎn)生成、技能檢索與適應(yīng)、強(qiáng)化學(xué)習(xí)和模仿學(xué)習(xí),以及不同的感官輸入,應(yīng)對更復(fù)雜和多樣的裝配挑戰(zhàn),推動接觸密集型操作的邊界。下面將重點(diǎn)介紹這一系列創(chuàng)新技術(shù)。
MatchMaker:
機(jī)器人裝配的自動化資產(chǎn)生成
圖 3. MatchMaker 資產(chǎn)生成流程
MatchMaker(在 ICRA 2025 上展示)是一種全新的生成式流程,可自動生成多樣化、兼容仿真的裝配資產(chǎn)對,以促進(jìn)裝配技能的學(xué)習(xí)。它通過生成無貫穿、幾何匹配的零件,解決了手動創(chuàng)建管理資產(chǎn)的挑戰(zhàn)。MatchMaker 支持三種可能的輸入——無輸入、單個(gè)資產(chǎn)或裝配對,并輸出具有可調(diào)間隙的可用于仿真的資產(chǎn)對。
主要功能:
自動轉(zhuǎn)換:將不兼容的資產(chǎn)對轉(zhuǎn)換為與仿真兼容的模型。
資產(chǎn)對生成:從單個(gè)資產(chǎn)創(chuàng)建幾何匹配的零件,用于新的裝配任務(wù)。
真實(shí)接觸交互:根據(jù)用戶定義的間隙貼近接觸表面,確保零件之間的真實(shí)交互。
如圖 3 所示,MatchMaker 作為形狀補(bǔ)全任務(wù),分三個(gè)階段生成裝配對:
接觸面檢測:基于VLM (GPT-4o) 識別資產(chǎn)類型、裝配方向與接觸軸;
形狀補(bǔ)全:使用3D生成模型生成裝配對中的第二個(gè)資產(chǎn);
間隙設(shè)定:貼近接觸面,避免穿模,并確保與仿真器兼容。
圖 4 展示了生成的資產(chǎn)示例。MatchMaker 已在仿真和真實(shí)環(huán)境中得到驗(yàn)證,證明了其在開發(fā)穩(wěn)健的裝配策略方面的有效性。
圖 4. MatchMaker 生成的裝配對示例
SRSA:
機(jī)器人裝配任務(wù)的技能檢索與適應(yīng)
SRSA(ICLR 2025 上的一個(gè)亮點(diǎn))是一個(gè)數(shù)據(jù)高效的機(jī)器人學(xué)習(xí)框架,能從裝配任務(wù)技能庫中重用和調(diào)整預(yù)訓(xùn)練技能。該框架根據(jù)幾何形狀、動力學(xué)、動作和預(yù)測成功率,為新任務(wù)選擇最優(yōu)現(xiàn)有策略,并針對目標(biāo)任務(wù)進(jìn)行策略微調(diào)。
圖 5. SRSA 可檢索和微調(diào)已有的最佳技能,然后再將其添加到技能庫中
與從零開始學(xué)習(xí)(比如使用 AutoMate 技術(shù)進(jìn)行學(xué)習(xí))相比,SRSA 具有更好的性能、效率和穩(wěn)定性,同時(shí)支持持續(xù)學(xué)習(xí)。它在新任務(wù)上的成功率提高了 19%,所需樣本減少了 2.4 倍,在真實(shí)世界測試中達(dá)到了 90% 的平均成功率。
TacSL:
用于視觸覺傳感器仿真和學(xué)習(xí)的庫
TacSL (taxel) 是一個(gè)基于 GPU 的視觸覺加速仿真庫(即主流機(jī)器人觸覺傳感器的輸出),可實(shí)現(xiàn)視觸覺傳感器及相應(yīng)接觸力場的仿真,速度比現(xiàn)有最先進(jìn)技術(shù)快 200 倍以上。
圖 6. TacSL 工具包的組件
觸覺感知對人類理解世界至關(guān)重要,能幫助我們感知壓力、紋理和形狀。在機(jī)器人中,觸覺感知 (tactile sensing) 是指使用特殊的觸覺傳感器檢測與物體的接觸,這一能力在抓取物體、零件裝配或調(diào)整抓握力等任務(wù)中尤為重要。盡管觸覺感知非常重要,但受限于數(shù)據(jù)分析難度大、真實(shí)觸覺仿真存在挑戰(zhàn),以及訓(xùn)練機(jī)器人基于觸覺數(shù)據(jù)執(zhí)行動作的復(fù)雜性較高,與視覺感知相比,觸覺感知在機(jī)器人中尚未廣泛應(yīng)用。
TacSL 通過針對視觸覺傳感器的快速 GPU 加速觸覺仿真模塊和學(xué)習(xí)算法,解決了這些長期存在的挑戰(zhàn)。它使機(jī)器人能夠在仿真中借助真實(shí)的觸覺反饋,學(xué)習(xí)接觸密集型任務(wù),比如插入銷釘。TacSL 支持大規(guī)模訓(xùn)練以及仿真到現(xiàn)實(shí)的成功遷移(成功率 83% 至 91%),使基于觸覺的學(xué)習(xí)更具實(shí)用性和可擴(kuò)展性。
視頻 1. 不同插銷位置、持銷釘位置和持銷釘方向的插入策略執(zhí)行,展示了對劇烈光照變化的魯棒性
FORGE:
在不確定性下實(shí)現(xiàn)穩(wěn)健的
接觸密集型操作的力引導(dǎo)探索
圖 7. FORGE 訓(xùn)練流程和多級行星齒輪箱裝配示例
FORGE 引入了一種方法,使以力測量值為輸入的強(qiáng)化學(xué)習(xí)策略能夠?qū)崿F(xiàn)零樣本仿真到現(xiàn)實(shí)的遷移。這種方法在零件位姿存在顯著不確定性或任務(wù)需要高精度和準(zhǔn)確性時(shí)非常重要。
主要功能:
力觀測輸入:自適應(yīng)調(diào)節(jié)操作期間施加的力度。
力閾值機(jī)制:限制最大力度以保護(hù)精密零件。
動態(tài)隨機(jī)化方案:在訓(xùn)練期間對機(jī)器人動力學(xué)和零件屬性進(jìn)行隨機(jī)化處理,以實(shí)現(xiàn)穩(wěn)健的真實(shí)世界泛化能力。
成功預(yù)測器:實(shí)現(xiàn)自主完成任務(wù),而不依賴固定持續(xù)時(shí)間的執(zhí)行。
憑借這些功能,即使在位置估計(jì)誤差高達(dá) 5 毫米的情況下,F(xiàn)ORGE 仍能夠支持安全探索和成功執(zhí)行。圖 8 展示了這一能力在多級行星齒輪系統(tǒng)裝配中的應(yīng)用。該任務(wù)需要三項(xiàng)裝配技能:插入銷釘、齒輪嚙合和螺母螺栓擰入。
圖8. FORGE在三項(xiàng)不同裝配技能中的應(yīng)用:插入銷釘、齒輪嚙合和螺母螺栓擰入
FORGE 能夠處理如卡扣插入等需要施加力的任務(wù),并在所需力未知時(shí),使用成功預(yù)測自動調(diào)整力度限制。這展示了其具備高精度處理復(fù)雜任務(wù)并適應(yīng)真實(shí)世界不確定性的能力。
總結(jié)
機(jī)器人裝配非常復(fù)雜,需要精確的接觸和真實(shí)世界的適應(yīng)性。本文重點(diǎn)介紹了在仿真到現(xiàn)實(shí)的遷移、觸覺和力傳感以及自動化資產(chǎn)生成方面的研究進(jìn)展,為更靈活、適應(yīng)性更強(qiáng)的自動化打下基礎(chǔ)。
這篇文章是“NVIDIA 機(jī)器人研究與開發(fā)摘要 (R2D2)”的一部分,旨在讓開發(fā)者更深入地了解 NVIDIA 研究中心在物理 AI 和機(jī)器人應(yīng)用方面的最新突破。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
29607瀏覽量
212151 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5282瀏覽量
106040 -
AI
+關(guān)注
關(guān)注
88文章
34765瀏覽量
276924
原文標(biāo)題:R2D2:通過 NVIDIA 研究中心的工作流,實(shí)現(xiàn)機(jī)器人裝配和接觸密集型操作
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
《電子發(fā)燒友電子設(shè)計(jì)周報(bào)》聚焦硬科技領(lǐng)域核心價(jià)值 第14期:2025.06.2--2025.06.6
I/O密集型任務(wù)開發(fā)指導(dǎo)
智能配送裝配機(jī)器人
機(jī)器人產(chǎn)業(yè)的路在何方
什么是工業(yè)機(jī)器人
智久AGV搬運(yùn)機(jī)器人呼喚更多中國籍的機(jī)器人
機(jī)器人VS人:替代還是協(xié)作?
工業(yè)機(jī)器人結(jié)構(gòu)、驅(qū)動及技術(shù)指標(biāo)詳解
工業(yè)機(jī)器人的技術(shù)原理
工業(yè)機(jī)器人視覺裝配實(shí)訓(xùn)平臺實(shí)驗(yàn)
計(jì)算密集型的程序簡析
機(jī)器人是如何實(shí)現(xiàn)運(yùn)作的呢
機(jī)器人裝配操作的控制綜述
搬運(yùn)機(jī)器人的出現(xiàn) 動了產(chǎn)業(yè)發(fā)展的轉(zhuǎn)變
使用NVIDIA Isaac的新型仿真方法推進(jìn)機(jī)器人裝配

評論