搭積木可不簡單。
除了訓(xùn)練小朋友的整體項(xiàng)目意識,這也是一個視覺、觸覺、交互和策略都需要上線的游戲。而在眾多的搭積木游戲中,“疊疊樂”可能是其中最有趣,難度也最高的一種。
疊疊樂,又名疊疊高,也叫疊疊木,是一款經(jīng)典的木制益智積木玩具。
游戲規(guī)則看似很簡單,從下方的積木中,抽一根往上搭。但是游戲過程極度考驗(yàn)?zāi)托院妥灾屏Α?/p>
這個游戲手殘黨反正是玩不了,手腳不是太靈活的小伙伴,也放棄吧。
但是,這個游戲?qū)IT團(tuán)隊(duì)研發(fā)的機(jī)器人來說,輕而易舉~
它是怎么做到的呢?
首先,在硬件方面,需要一個軟齒夾鉗、一個力傳感腕帶以及一個外部攝像頭,這些部件是用于觀察和感應(yīng)積木塔以及積木的。
其次,當(dāng)機(jī)器人小心地推動一塊積木時,計(jì)算機(jī)利用外部攝像頭和力傳感腕帶分別接收視覺和觸覺反饋,然后與機(jī)器人先前做出的動作進(jìn)行比較。
在此過程中還需考慮了不同動作可能產(chǎn)生的結(jié)果——具體來說就是能否用特定的力度,抽出特定位置的積木放在塔頂并確保積木塔不倒。機(jī)器人會實(shí)時 “學(xué)習(xí)”是否繼續(xù)推動這塊積木來防止積木塔倒塌。
具體來說,與國際象棋、圍棋等更依賴認(rèn)知思維的任務(wù)或游戲不同,玩疊疊樂還需要掌握物理技巧,如試探、推、拉、放置和碼齊。
這項(xiàng)游戲需要交互式感知和操作,你必須去觸摸積木塔才能學(xué)會何時以及如何移動積木。
整個過程很難模擬,機(jī)器人必須和現(xiàn)實(shí)中的積木塔進(jìn)行交互來學(xué)習(xí)。主要的困難是,如何利用物體和物理常識從相對較少的實(shí)驗(yàn)中學(xué)習(xí)。
當(dāng)然,MIT團(tuán)隊(duì)并不止步疊疊樂游戲,目前開發(fā)的觸覺學(xué)習(xí)系統(tǒng)正應(yīng)用在垃圾分類回收、組裝消費(fèi)品等需要精確物理交互的任務(wù)。
相關(guān)研究細(xì)節(jié)發(fā)表在最近的《Science Robotics》期刊上。論文的第一作者是麻省理工學(xué)院的研究生Nima Fazeli。研究團(tuán)隊(duì)還包括Miquel Oller,Jiajun Wu,Zheng Wu和麻省理工學(xué)院大腦和認(rèn)知科學(xué)教授Joshua Tenenbaum。
論文地址:
http://robotics.sciencemag.org/content/4/26/eaav3123
這項(xiàng)工作是開創(chuàng)性的,麻省理工學(xué)院機(jī)械工程系的Alberto Rodriguez評論道:“疊疊樂機(jī)器人展示了之前的機(jī)器人系統(tǒng)無法做到的事:快速學(xué)習(xí)執(zhí)行任務(wù)的最優(yōu)方法。它不僅利用常用的視覺反饋,還包括觸覺反饋和物理交互?!?/p>
例如,在手機(jī)生產(chǎn)流水線上,幾乎每一步都需要卡扣連接和螺絲固定,在這個過程中是依靠力和觸摸來判斷是否正確組裝的,而不是視覺。
而這項(xiàng)技術(shù)的靈魂就正是是研究人員精心構(gòu)建的學(xué)習(xí)模型。
推拉
在疊疊樂游戲中,54塊長方形積木垂直交錯堆疊成18層的積木塔,每層有三塊積木,玩家輪流抽出一塊積木放在塔頂來增加積木塔的高度,但是又不能使積木塔倒下。
想讓機(jī)器人學(xué)會玩疊疊樂,傳統(tǒng)的做法是收集積木塊、積木塔和機(jī)器人三者之間可能發(fā)生的所有交互,這需不但要耗費(fèi)大量計(jì)算資源,還需要成千上萬次抽積木的操作。
Rodriguez和他的同伴從人類認(rèn)知和實(shí)際操作角度尋找到了一種更有效的數(shù)據(jù)處理方式。
這個團(tuán)隊(duì)定制了一個行業(yè)標(biāo)準(zhǔn)的ABB IRB 120機(jī)械臂,在機(jī)器人能夠觸到的范圍內(nèi)搭建了一個積木塔,然后開始訓(xùn)練。機(jī)器人首先隨機(jī)選擇一塊積木和推動積木的位置,然后用較小的力試圖將積木推出塔外。
計(jì)算機(jī)則會在這個過程中記錄每次嘗試的視覺和力量數(shù)據(jù),并標(biāo)注是否成功。
這個機(jī)器人沒有進(jìn)行成千上萬次的嘗試(包括多次重建積木塔),它只進(jìn)行了大約300次的嘗試。把相似的數(shù)據(jù)和結(jié)果進(jìn)行聚類分組,表示特定的積木行為。例如,一組數(shù)據(jù)可能表示很難移動的積木,另一組可能表示比較容易移動的積木,或者移動后積木塔會倒塌的積木。對于每一組數(shù)據(jù),開發(fā)一個簡單的模型,機(jī)器人將會基于它現(xiàn)有的視覺和觸覺數(shù)據(jù)來預(yù)測移動一塊積木的行為。
Fazeli說:“這種聚類技術(shù)受到人類認(rèn)知過程的啟發(fā),顯著提高了機(jī)器人學(xué)習(xí)游戲的效率。讓機(jī)器人建立數(shù)據(jù)集群,然后學(xué)習(xí)每個集群的模型,而不是學(xué)習(xí)一個能夠捕捉所有可能性的模型?!?/p>
堆疊
研究者用模擬器MuJoCo,在計(jì)算機(jī)模擬的疊疊樂游戲中與其他如今最先進(jìn)的機(jī)器學(xué)習(xí)算法進(jìn)行比試,從而了解疊疊樂機(jī)器人在現(xiàn)實(shí)世界中的學(xué)習(xí)方式。
Oller說:“我們把我們系統(tǒng)獲得的數(shù)據(jù)信息提供給這些算法,看它們是如何玩疊疊樂的。與我們的算法相比,這些算法需要搭建更大數(shù)量級的積木塔才能學(xué)會這個游戲?!?/p>
研究團(tuán)隊(duì)讓疊疊樂機(jī)器人與人類志愿者進(jìn)行了幾次非正式比賽。
Oller說:“我們看到積木塔倒塌之前人類能抽出幾個積木塊,我們的機(jī)器人和人類不相上下?!?/p>
但是,疊疊樂機(jī)器人在與人類玩家進(jìn)行正式比賽之前還有很長的路要走。除了物理交互,疊疊樂游戲還需要一些策略,比如抽出一塊積木,既不使積木塔倒塌又能使對手很難抽出下一塊積木。
目前,研究團(tuán)隊(duì)并不致力于讓機(jī)器人獲得疊疊樂冠軍,他們更想把這一新技能應(yīng)用到其他領(lǐng)域。
Rodriguez說:“我們用手完成的很多任務(wù)都是憑感覺,這種感覺來自力量和觸覺反饋,我們的算法可以完成這類任務(wù)。”
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
29731瀏覽量
212842 -
攝像頭
+關(guān)注
關(guān)注
61文章
4979瀏覽量
98357 -
機(jī)械臂
+關(guān)注
關(guān)注
13文章
554瀏覽量
25378
原文標(biāo)題:有觸覺,懂策略,能交互!MIT開發(fā)出比你更靈活的搭積木大師,還發(fā)了Science子刊
文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
評論