一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

我們能否讓機器人以同觀察和實踐學(xué)會使用工具?

電子工程師 ? 來源:lq ? 2019-04-29 18:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

動物學(xué)習(xí)使用工具的技能大多來自觀察學(xué)習(xí)和實踐。例如通過觀察,黑猩猩學(xué)會了用樹枝“捕捉”昆蟲,卷尾猴會用棍子將食物掃到身邊。雖然我們不知道它們是否只是“機械模仿”,但我們相信這種使用工具的能力代表著一種更高水平的智力。

大猩猩用木棍收集草藥

一個值得探討的問題:我們能否讓機器人以同樣的方式——觀察和實踐 ——學(xué)會使用工具?

執(zhí)行這種復(fù)雜的多對象操作任務(wù)(例如涉及工具使用的任務(wù))的前提是理解物體間的物理因果關(guān)系,也就是要能夠預(yù)測一個物體如何與另一個物體相互作用的。我們在之前的視覺模型強化學(xué)習(xí)的研究中探究過機器人在沒有監(jiān)測的情況下怎樣利用因果視覺預(yù)測模型與周圍環(huán)境互動。學(xué)習(xí)這樣的模型之后,機器人可以完成各種簡單的任務(wù),包括折疊衣物和擺放物體。但是,如果我們考慮有更多工具的情況,例如用掃帚將污垢掃入簸箕,這種學(xué)習(xí)模型是不夠的。

利用因果視覺預(yù)測模型與周圍環(huán)境互動

https://bair.berkeley.edu/blog/2018/11/30/visual-rl/

因此,我們從動物的學(xué)習(xí)方式中汲取靈感,設(shè)計了一種算法,使機器人可以通過模仿和互動式學(xué)習(xí)獲得工具使用技能。尤其是我們的設(shè)計還可以通過混合示范數(shù)據(jù)和無監(jiān)督學(xué)習(xí),使機器人在沒有已知工具的情況下,可以使用其他新物體作為臨時工具。此外,根據(jù)設(shè)計的需要,我們的機器人還可以自行決定是否使用被提供的工具。在這篇文章中,我將解釋其中原理。

我們的設(shè)計使機器人明白如何使用不同的物體作為工具來實現(xiàn)指定的任務(wù)(根據(jù)黃色箭頭標(biāo)記)。機器人在執(zhí)行任務(wù)期間自行決定是否使用已提供的工具。

從示范中學(xué)習(xí)

首先,我們用示范數(shù)據(jù)集來說明如何使用各種工具。因為我們最終希望機器人學(xué)習(xí)一種對各種工具使用技能都有用的模型,所以我們收集了使用不同工具完成各種任務(wù)的示范數(shù)據(jù)。對于每次示范,我們都會用機器人自帶攝像頭記錄圖像序列,包括工具的位置和各種指令的動作。

運動示范例子

通過這些數(shù)據(jù),我們可以擬合一個模型,設(shè)計一系列動作,使機器人能夠?qū)?dāng)前場景中的物體用作工具。并且,為了得到示范中各種動作的范圍,該動作設(shè)計模型輸出了動作序列的分布。

視覺預(yù)測模型的無監(jiān)督數(shù)據(jù)集

由于我們希望機器人不只是機械模仿示范的行為,而是能夠應(yīng)對新物體和新情況,因此我們需要大量不同的數(shù)據(jù)。也就是說,機器人可以自主收集數(shù)據(jù)。例如,我們希望機器人能夠理解小失誤,有偏差的抓取可能會影響其下一步動作。因此,我們要讓機器人通過自己收集的數(shù)據(jù)來累積經(jīng)驗。

機器人還可以兩種不同的方式自主收集數(shù)據(jù):通過隨機的動作序列收集數(shù)據(jù)或者通過之前強化學(xué)習(xí)模型輸入的動作樣本收集數(shù)據(jù)。后者使機器人可以抓住工具并隨意移動它們,這對于理解多物體相互作用至關(guān)重要。

我們最終的數(shù)據(jù)集包括專業(yè)示范數(shù)據(jù),機器人對各種工具的自學(xué)經(jīng)驗以及BAIR機器人交互數(shù)據(jù)。我們用這個數(shù)據(jù)集來訓(xùn)練機器人的動態(tài)模型。該模型使用循環(huán)卷積神經(jīng)網(wǎng)絡(luò),輸入先前收集的圖像和每個時間點的動作,就可以生成下一個圖像預(yù)測以作出反應(yīng)。

示范指導(dǎo)動作

在測試時,機器人可以使用模擬數(shù)據(jù)訓(xùn)練的模型來指導(dǎo)動作計劃過程和預(yù)測模型,以確定采取哪些動作可以完成它要執(zhí)行的任務(wù)。

新任務(wù)是通過用戶提供的物體移動關(guān)鍵點位置來指定的。例如,我們想要機器人把垃圾掃進簸箕,就可以選擇垃圾的中心點和垃圾在簸箕上的最終位置來確定任務(wù)(見下圖)。用這種方式指定任務(wù)不會告訴機器人如何使用某工具,甚至不會告訴它在這個場景下有哪種工具可以使用,機器人必須在其動作規(guī)劃過程中自行確定。

我們使用基于抽樣的動作計劃程序,利用動作設(shè)計和視頻預(yù)測模型,使機器人可以使用不同的工具和物體來完成各種任務(wù)。需要指出的是,動作序列最初是來自動作設(shè)計模型的隨機采樣。然后,我們再通過視頻預(yù)測模型來預(yù)測每個動作計劃的結(jié)果。

對同一初始場景不同動作序列的視頻預(yù)測

通過采用頂層計劃(最有可能導(dǎo)致期望結(jié)果的動作序列)并使其合理分布,我們可以重復(fù)采樣并改進最頂層計劃,然后讓機器人執(zhí)行。

實踐

我們嘗試此方法使機器人能夠使用新工具來完成用戶指定的任務(wù)。

左:帶有任務(wù)指示箭頭的初始場景。中:與最佳計劃相對應(yīng)的視頻預(yù)測。右:機器人執(zhí)行計劃。

在前文提到的任務(wù)中,機器人使用附近的掃把來更有效地執(zhí)行任務(wù):

盡管機器人之前從未見過海綿,但它可以自學(xué)如何使用它來清潔盤子上的碎屑:

在下面的示例中,機器人只能在綠色陰影區(qū)域內(nèi)移動,并且需要將藍色圓柱體向自己方向拉。這個示例的關(guān)鍵是,機器人學(xué)會如何使用L形鉤來完成任務(wù):

而且,即使出現(xiàn)諸如瓶子一類的普通物體時,機器人也可以推斷出如何將其用作工具來完成任務(wù):

最后,在可以不使用工具的情況下,機器人選擇用自己的鉗子完成任務(wù):

場景1:機器人使用工具從而更有效地移動兩個對象。

場景2:機器人忽略鉤型工具,用自己的鉗子移動單個物體。

除了這些例子之外,我們在論文中的定量結(jié)果表明,我們的方法比只從示范中學(xué)習(xí)更通用,比只從經(jīng)驗中學(xué)習(xí)更能提高機器人的能力。

其他相關(guān)研究

先前的深度學(xué)習(xí)研究探索了在指定任務(wù)和運動計劃框架下使用邏輯編程和已知模型的如何讓機器人操作工具。但是,基于邏輯和基于分析模型的系統(tǒng)容易受到建模錯誤的影響,這些錯誤可能會在測試執(zhí)行期間累積,從而影響整個系統(tǒng)。

其他研究包括將工具的使用分解為面向任務(wù)的學(xué)習(xí),及使用計劃或策略學(xué)習(xí)來操作工具等。這些方法將機器人的運動范圍限制在工具附近的區(qū)域內(nèi),而我們的方法能夠應(yīng)對周圍有工具或沒有工具的不同情況。

還有一些研究還提出了工具使用的動態(tài)學(xué)習(xí)模型。然而,不同于這些使用手工設(shè)計的感知通道或完全放棄感知的方法,我們的方法可以直接從原始圖像像素中學(xué)習(xí)物體之間的交互作用。

結(jié)論

執(zhí)行涉及未知物體的多樣化復(fù)雜任務(wù)是機器人技術(shù)中的一項挑戰(zhàn),我們研究學(xué)習(xí)了將物體作為工具來使用的不同任務(wù)。我們演示了我們的方法,它結(jié)合了模仿和自我監(jiān)督的交互學(xué)習(xí),使機器人能夠用多個物體完成復(fù)雜的任務(wù),甚至可以在新場景下使用臨時工具。我們希望這項研究代表著機器人向更通用和更強大邁出的一步,這樣它們終有一天可以在現(xiàn)實環(huán)境下執(zhí)行任務(wù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    29712

    瀏覽量

    212729
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1223

    瀏覽量

    25428
  • 強化學(xué)習(xí)
    +關(guān)注

    關(guān)注

    4

    文章

    269

    瀏覽量

    11594

原文標(biāo)題:伯克利BAIR最新研究:讓機器人自己學(xué)會使用工具

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】+內(nèi)容初識

    機器人技術(shù)的飛速發(fā)展,ROS 2 作為其核心工具之一,為開發(fā)者提供了強大的支持。與傳統(tǒng)的理論書籍不同,本書深入淺出地講解了 ROS 2 的架構(gòu)、開發(fā)流程以及在智能機器人項目中的應(yīng)用,
    發(fā)表于 04-27 11:24

    表情機器人網(wǎng)絡(luò)大賽

    ,并有專人慢慢教你如何利用C語言來控制臉部表情,完全沒學(xué)過C語言的人都能輕輕松松的制作自己的產(chǎn)品來參加比賽,我們期望透過這樣的比賽,機器人能成為一個附有教育性質(zhì)的休閑活動,能讓
    發(fā)表于 09-11 09:17

    表情機器人網(wǎng)絡(luò)大賽

    洪水野獸一樣的害怕,有些想學(xué)機器人,卻不知如何入門,我們舉辦表情機器人大賽就是要突破這層迷思,有專業(yè)的技術(shù)討論區(qū),并有專人慢慢教你如何利用C語言來控制臉部表情,
    發(fā)表于 09-15 09:44

    當(dāng)前最實用的十大醫(yī)療機器人

    機器人對于醫(yī)療保健行業(yè)并不陌生。我們知道,已經(jīng)有大量的機器人被用于各種物理治療中,還有一些機器人被用于幫助訓(xùn)練醫(yī)生進行一系列治療和手術(shù)。下面這10個
    發(fā)表于 03-02 15:05

    簡易機器人DIY——常用工具

    相信在很多學(xué)電子的童鞋。心中都一個機器人的夢。就算是不學(xué)電子的童鞋,也有不少喜歡機器人的。其實自己動手做一個簡易機器人其實也很簡單。不過別忘了準(zhǔn)備好工具。有了
    發(fā)表于 03-06 09:48

    我與我的機器人

    ”,可以在小車的基礎(chǔ)上添加各種傳感器,使得它像我們人類一樣躲避障礙物、遇到緊急的事件能夠及時的處理。這學(xué)期我們開設(shè)《AVR單片機與小型機器人制作》這門課,我有更多的機會接觸
    發(fā)表于 08-05 22:49

    機器人與未來

    將會遭到哪些改變,我們最終將如何重新定義我們機器人彼此的身份?為回答這個問題,《機器人與未來》在書中每一章講述了一種機器人可能的未來,首先
    發(fā)表于 12-29 14:56

    當(dāng)我們談?wù)?b class='flag-5'>機器人的時候,我們到底該談什么?

    自從上個世紀(jì)二十年代捷克語中的「Robata」(奴隸)被引進英語以來,「Robot」這個詞最初被用來描述一些人們不舒服的東西。上世紀(jì)三十年代,人們一直在擔(dān)憂機器人竊取自己的工作、獲得知覺,并最終
    發(fā)表于 01-11 14:16

    資料:移動機器人能否自動充電?

    現(xiàn)在我們的社會已經(jīng)越來越智能化,有科學(xué)家曾說,按照現(xiàn)在科技進展的速度,再過5到10年我們就將進入機器人時代?,F(xiàn)在我們機器人也不是那么陌生,
    發(fā)表于 01-20 09:39

    機器人制作實踐入門教程

    [img][/img]STM32-機器人制作實踐入門教程
    發(fā)表于 08-16 09:59

    機器人10大流行編程語言對比,你學(xué)會了哪種?

    有超過1500種編程語言,要學(xué)的話太多了。今天我們學(xué)習(xí)的是目前機器人技術(shù)中十種最流行的編程語言,而每種語言對機器人都有不同的有點,那么接下來就來看看它們的區(qū)別: 1. C / C ++達到機器
    發(fā)表于 12-05 16:42

    教育機器人方興未艾,你了解多少?

    達到2.4億美元,每年20%左右的速度增長。目前,我們正處于人類與機器交互的十字路口。但綜合目前的研究結(jié)果都顯示,孩子可以通過同機器人的互動獲益匪淺。教育
    發(fā)表于 12-20 10:01

    基于視覺的機器人SLAM入門實踐

    嵌入式系統(tǒng)開發(fā)與應(yīng)用——基于視覺的機器人SLAM入門實踐1一、OpenCV的安裝與配置1. 下載OpenCV3.4.1并解壓到ubuntu相應(yīng)目錄上2. 下載安裝依賴庫和編譯工具cmake(1)更新
    發(fā)表于 12-16 08:16

    機器人是什么?

    機器。一些書呆子式的語言可能會把它描述成“一個可重新編程的多功能機械手,旨在通過各種編程的動作移動材料、部件、工具或?qū)iT設(shè)備,完成各種任務(wù)”。這個定義非常具有表現(xiàn)力。那么制造機器人
    發(fā)表于 03-31 10:31

    未來我們的食品會是工業(yè)機器人制造的嗎

    現(xiàn)在不僅在汽車與電子在生產(chǎn)的過程中會使用工業(yè)機器人,在我們的食品制造的行業(yè)也有了工業(yè)機器人的身影。在食品包裝、食品安全和食品衛(wèi)生中工業(yè)
    發(fā)表于 10-18 16:52 ?829次閱讀