一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個(gè)開源的低成本機(jī)器人學(xué)習(xí)平臺(tái)ROBEL

機(jī)器人技術(shù)與應(yīng)用 ? 來源:機(jī)器人技術(shù)與應(yīng)用 ? 2019-11-25 11:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

為了讓機(jī)器人研究走向大眾,加州大學(xué)伯克利分校(UC Berkeley)和谷歌大腦的研究人員提出了一個(gè)開源的低成本機(jī)器人學(xué)習(xí)平臺(tái)ROBEL(RoboticsBenchmarks for Learning with Low-Cost Robots)。

ROBEL可以作為快速實(shí)驗(yàn)平臺(tái),支持各種實(shí)驗(yàn)需求,以及新的強(qiáng)化學(xué)習(xí)和控制方法的開發(fā),同時(shí)提供主要用于促進(jìn)現(xiàn)實(shí)世界物理硬件研究和開發(fā)的基準(zhǔn)任務(wù)。其由D’Claw和D'Kitty組成,D'Claw是一個(gè)有三只手臂的機(jī)械臂型機(jī)器人,可以幫助學(xué)習(xí)靈巧的操作任務(wù);D'Kitty是一個(gè)有四條腿的機(jī)器人,可以幫助學(xué)習(xí)靈活的腿部運(yùn)動(dòng)任務(wù)。該機(jī)器人平臺(tái)具有低成本、模塊化、可靠性高、易于維護(hù)等特點(diǎn),并且功能強(qiáng)大,可支持基于硬件的強(qiáng)化學(xué)習(xí)。

圖中左:十二自由度D'Kitty;中:9 自由度D'Claw;右:功能齊全的D'Claw 裝置D’Lantern。

為了使機(jī)器人成本便宜和易于構(gòu)建,研究人員基于現(xiàn)成的組件和常見的原型工具(3D打印或激光切割)設(shè)計(jì)了ROBEL。該設(shè)計(jì)很容易組裝,只需要幾個(gè)小時(shí)即可構(gòu)建。

為了使機(jī)器人成本低且易于構(gòu)建,研究人員基于現(xiàn)成的組件和常用的原型制作工具(3D打印或激光切割)設(shè)計(jì)出ROBEL,并提供詳細(xì)的零件清單、組裝說明和入門軟件說明。ROBEL設(shè)計(jì)易于組裝,僅需幾個(gè)小時(shí)即可構(gòu)建。

谷歌設(shè)計(jì)了一套對(duì) D’Claw和D’Kitty兩個(gè)平臺(tái)都適用的任務(wù),可用于對(duì)現(xiàn)實(shí)世界的機(jī)器人學(xué)習(xí)進(jìn)行基準(zhǔn)測(cè)試。ROBEL的任務(wù)定義包括密集和稀疏任務(wù)目標(biāo),并在任務(wù)定義中引入硬件安全指標(biāo),例如,指示關(guān)節(jié)是否超過“安全”操作界限或作用力閾值。此外,ROBEL還為所有任務(wù)提供模擬器,以促進(jìn)算法開發(fā)和快速原型設(shè)計(jì)。D’Claw 任務(wù)主要圍繞三種常見的操作行為展開:擺形(Pose)、旋轉(zhuǎn)(Turn)和擰(Screw);D’Kitty任務(wù)主要圍繞三種常見的移動(dòng)行為——站立、定向和行走展開。針對(duì)這些基準(zhǔn)任務(wù),研究人員評(píng)估了幾種深度強(qiáng)化學(xué)習(xí)方法,評(píng)估結(jié)果和最終策略被作為baseline包含在軟件包中以供比較。

ROBEL平臺(tái)支持直接的硬件訓(xùn)練,迄今已積累了超過1.4萬h的實(shí)際經(jīng)驗(yàn)。為了確保平臺(tái)和基準(zhǔn)方法的可重復(fù)性,研究人員通過兩個(gè)不同的實(shí)驗(yàn)室分別對(duì)ROBEL進(jìn)行了研究,本研究?jī)H使用軟件分發(fā)和文檔、不允許親自訪問,利用ROBEL的設(shè)計(jì)文檔和組裝說明,兩者都可以復(fù)制兩個(gè)硬件平臺(tái)?;鶞?zhǔn)任務(wù)訓(xùn)練在兩個(gè)實(shí)驗(yàn)室分別構(gòu)建的機(jī)器人上進(jìn)行,實(shí)驗(yàn)表明,在兩個(gè)不同地點(diǎn)打造的兩個(gè)D'Claw機(jī)器人,它們不僅訓(xùn)練進(jìn)度相似,而且最終收斂到了相同的性能,這說明ROBEL基準(zhǔn)具備良好的可重復(fù)性。

ROBEL在各種強(qiáng)化學(xué)習(xí)研究中都非常有用。D’Claw平臺(tái)是完全自主的,可以在很長一段時(shí)間內(nèi)維持實(shí)驗(yàn)的可靠性,而且可以使用剛性和柔性對(duì)象的各種強(qiáng)化學(xué)習(xí)范例和任務(wù)改進(jìn)實(shí)驗(yàn)。重要的是,D'Claw平臺(tái)是高度模塊化的,而且具備高度可重復(fù)性,便于進(jìn)行擴(kuò)展實(shí)驗(yàn)。通過擴(kuò)展設(shè)置,研究人員發(fā)現(xiàn)多個(gè)D'Claws可以通過共享經(jīng)驗(yàn)更快地對(duì)任務(wù)進(jìn)行集體學(xué)習(xí),通過共享SAC的分布式版本的硬件訓(xùn)練流程,其可以面向多個(gè)目標(biāo)任務(wù)實(shí)現(xiàn)任意角度的結(jié)合。在多任務(wù)定制中,完成五個(gè)任務(wù)只需要單個(gè)任務(wù)經(jīng)驗(yàn)的2倍時(shí)間即可。

同時(shí),研究人員成功地在D’Kitty平臺(tái)上部署了強(qiáng)大的移動(dòng)策略,比如,D'Kitty可以在“盲眼”條件下在室內(nèi)和室外地形上穩(wěn)定行走,展現(xiàn)了步態(tài)的穩(wěn)健性。

具體而言,在雜亂的室內(nèi)環(huán)境行走時(shí),通過MuJoCo模擬通過自然策略梯度訓(xùn)練的Sim2Real策略,機(jī)器人可以在隨機(jī)擾動(dòng)的條件下實(shí)現(xiàn)行走,并跨過障礙物;在布滿碎石和樹枝的室外環(huán)境行走時(shí),通過自然策略梯度在MuJoCo模擬中訓(xùn)練的Sim2Real策略具有隨機(jī)的高度場(chǎng),機(jī)器人可以學(xué)習(xí)在分布著碎石和樹枝的戶外環(huán)境中行走;在室外斜坡和草叢環(huán)境中,通過自然策略梯度在MuJoCo模擬中訓(xùn)練的Sim2Real策略具有隨機(jī)高度場(chǎng),機(jī)器人可以學(xué)習(xí)在緩坡上行走。

當(dāng)D’Kitty收到有關(guān)其軀干和場(chǎng)景中目標(biāo)的信息時(shí),其可以學(xué)會(huì)與表現(xiàn)出復(fù)雜行為的目標(biāo)進(jìn)行交互。比如,通過HierarchicalSim2Real訓(xùn)練的策略可以學(xué)習(xí)躲避移動(dòng)障礙物,到達(dá)目標(biāo)位置;通過Hierarchical Sim2Real訓(xùn)練的策略學(xué)習(xí)將目標(biāo)推向移動(dòng)目標(biāo)(由手中的控制器標(biāo)記);雙機(jī)器人協(xié)同-通過Hi-Herarchical Sim2Real訓(xùn)練的策略,可以學(xué)習(xí)協(xié)調(diào)兩個(gè)D'Kitty機(jī)器人,將沉重的障礙物推向目標(biāo)位置。

總之,ROBEL可以滿足新興的基于學(xué)習(xí)范式的需求,這些范式需要高度的可擴(kuò)展性和彈性。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29729

    瀏覽量

    212822
  • 3D打印
    +關(guān)注

    關(guān)注

    27

    文章

    3590

    瀏覽量

    112471

原文標(biāo)題:加州大學(xué)伯克利分校和谷歌大腦聯(lián)合推出低成本機(jī)器人訓(xùn)練平臺(tái)

文章出處:【微信號(hào):robotmagazine,微信公眾號(hào):機(jī)器人技術(shù)與應(yīng)用】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化學(xué)習(xí)腳本使用指南

    Lab 是個(gè)適用于機(jī)器人學(xué)習(xí)開源模塊化框架,其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,Isaac Lab 同時(shí)支持模仿學(xué)習(xí)(模仿人類)和強(qiáng)
    的頭像 發(fā)表于 07-14 15:29 ?513次閱讀
    NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>腳本使用指南

    通過NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)

    通用機(jī)器人的時(shí)代已經(jīng)到來,這得益于機(jī)械電子技術(shù)和機(jī)器人 AI 基礎(chǔ)模型的進(jìn)步。但目前機(jī)器人技術(shù)的發(fā)展仍面臨個(gè)關(guān)鍵挑戰(zhàn):
    的頭像 發(fā)表于 07-14 11:49 ?150次閱讀
    通過NVIDIA Cosmos模型增強(qiáng)<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    盤點(diǎn)#機(jī)器人開發(fā)平臺(tái)

    Athena機(jī)器人****開發(fā)平臺(tái)思嵐推出Athena機(jī)器人開發(fā)平臺(tái),有望主導(dǎo)機(jī)器人開發(fā)平臺(tái)未來
    發(fā)表于 05-13 15:02

    大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品

    全球80多個(gè)國家和地區(qū)。 近日,大象機(jī)器人聯(lián)合進(jìn)迭時(shí)空推出全球首款RISC-V全棧開源六軸機(jī)器臂“myCobot 280 RISC-V”,為開發(fā)者打造全新的機(jī)器人
    發(fā)表于 04-25 17:59

    構(gòu)建人形機(jī)器人學(xué)習(xí)的合成運(yùn)動(dòng)生成流程

    通用人形機(jī)器人需要能夠快速適應(yīng)現(xiàn)有的以人類為中心的城市和工業(yè)工作空間,處理繁瑣、重復(fù)或體力要求高的任務(wù)。這些移動(dòng)機(jī)器人經(jīng)過設(shè)計(jì),能在以人類為中心的環(huán)境中有出色的表現(xiàn),從工廠車間到醫(yī)療醫(yī)療機(jī)構(gòu),它們的價(jià)值日益凸顯。
    的頭像 發(fā)表于 04-10 09:36 ?618次閱讀
    構(gòu)建人形<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>的合成運(yùn)動(dòng)生成流程

    深度解讀英偉達(dá)Newton機(jī)器人平臺(tái):技術(shù)革新與跨界生態(tài)構(gòu)建

    的基礎(chǔ)上,它使機(jī)器人能夠學(xué)習(xí)如何以更高的精度處理復(fù)雜的任務(wù),與MuJoCo Playground或 NVIDIA Isaac Lab 等學(xué)習(xí)框架兼容,這是
    的頭像 發(fā)表于 03-20 15:15 ?1725次閱讀
    深度解讀英偉達(dá)Newton<b class='flag-5'>機(jī)器人平臺(tái)</b>:技術(shù)革新與跨界生態(tài)構(gòu)建

    AgiBot World Colosseo:構(gòu)建通用機(jī)器人智能的規(guī)?;瘮?shù)據(jù)平臺(tái)

    數(shù)據(jù)的匱乏,制約了通用操縱能力的突破。上海人工智能實(shí)驗(yàn)室與AgiBot公司聯(lián)合研發(fā)的AgiBot World Colosseo平臺(tái),通過構(gòu)建大規(guī)模、多模態(tài)的真實(shí)世界數(shù)據(jù)集與通用政策模型,為機(jī)器人學(xué)習(xí)
    的頭像 發(fā)表于 03-12 11:42 ?1083次閱讀
    AgiBot World Colosseo:構(gòu)建通用<b class='flag-5'>機(jī)器人</b>智能的規(guī)?;瘮?shù)據(jù)<b class='flag-5'>平臺(tái)</b>

    開源項(xiàng)目!教你如何制作個(gè)開源教育機(jī)械臂

    和適應(yīng)性強(qiáng)的機(jī)器人平臺(tái)。 作為個(gè)開源項(xiàng)目,構(gòu)建Pedro所需的所有文件都可以在Pedro Github頁面上找到: 用于3D打印和定制的STL文件。 Gerber文件來制造您自己的
    發(fā)表于 03-10 11:22

    構(gòu)建人形機(jī)器人學(xué)習(xí)的合成運(yùn)動(dòng)生成管線

    通用人形機(jī)器人旨在快速適應(yīng)現(xiàn)有的以人類為中心的城市和工業(yè)工作空間,處理繁瑣、重復(fù)或體力要求高的任務(wù)。這些移動(dòng)機(jī)器人經(jīng)過設(shè)計(jì),能在以人類為中心的環(huán)境中有出色的表現(xiàn),從工廠車間到醫(yī)療保健機(jī)構(gòu),它們的價(jià)值日益凸顯。
    的頭像 發(fā)表于 01-16 10:58 ?982次閱讀
    構(gòu)建人形<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>的合成運(yùn)動(dòng)生成管線

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

    工智能 認(rèn)知發(fā)展機(jī)器人學(xué) 進(jìn)化機(jī)器人學(xué) 物理體現(xiàn)與互動(dòng) 五、具身智能的現(xiàn)代技術(shù)方向 另外,隨著GPT等大語言模型的發(fā)展,這些技術(shù)也在具身智能機(jī)器人領(lǐng)域掀起了股浪潮,那就是基于大
    發(fā)表于 12-28 21:12

    如何選擇云原生機(jī)器學(xué)習(xí)平臺(tái)

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺(tái)因其彈性擴(kuò)展、高效部署、低成本運(yùn)營等優(yōu)勢(shì),逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 12-25 11:54 ?452次閱讀

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    動(dòng)態(tài)互動(dòng)的。 該理論強(qiáng)調(diào)智能行為源于智能體的物理存在和行為能力,智能體必須具備感知環(huán)境并在其中執(zhí)行任務(wù)的能力。具身智能的實(shí)現(xiàn)涵蓋了機(jī)器學(xué)習(xí)、人工智能、機(jī)器人學(xué)、計(jì)算機(jī)視覺、自然語言處理及強(qiáng)化學(xué)
    發(fā)表于 12-20 19:17

    使用機(jī)器學(xué)習(xí)和NVIDIA Jetson邊緣AI和機(jī)器人平臺(tái)打造機(jī)器人導(dǎo)盲犬

    Selin Alara Ornek 是名富有遠(yuǎn)見的高中生。她使用機(jī)器學(xué)習(xí)和 NVIDIA Jetson 邊緣 AI 和機(jī)器人平臺(tái),為視障人士打造了
    的頭像 發(fā)表于 11-08 10:05 ?804次閱讀

    開源項(xiàng)目!用ESP32做一個(gè)可愛的無用機(jī)器人

    簡(jiǎn)介 作者在完成碩士論文答辯后,利用空閑時(shí)間制作了個(gè)直想做的機(jī)器人——可愛無用機(jī)器人。 無用機(jī)
    發(fā)表于 09-03 09:34

    開源項(xiàng)目!用ESP32做一個(gè)可愛的無用機(jī)器人

    簡(jiǎn)介 作者在完成碩士論文答辯后,利用空閑時(shí)間制作了個(gè)直想做的機(jī)器人——可愛無用機(jī)器人。 無用
    發(fā)表于 08-30 14:50