我們擁有靈巧的雙手,可以在鍵盤上優(yōu)雅的舞蹈、可以在搖桿上精確的控制、甚至可以在設(shè)備上進(jìn)行精密的裝調(diào),這一切都離不開敏銳準(zhǔn)確的觸覺(jué)。對(duì)于機(jī)器人來(lái)說(shuō),僅僅依靠視覺(jué)和力傳感對(duì)于很多復(fù)雜任務(wù)是遠(yuǎn)遠(yuǎn)不夠的。沒(méi)有觸覺(jué)它們就無(wú)法準(zhǔn)確感知邊緣的位置、表面的強(qiáng)度和接觸點(diǎn)的質(zhì)地,此外很多時(shí)候相機(jī)的視線還會(huì)擋住無(wú)法進(jìn)行視覺(jué)伺服。但為機(jī)器人賦予優(yōu)異的觸覺(jué)感知卻不是一件容易的事,科學(xué)家們嘗試了多種不同的傳感器但每一種都有著各自無(wú)法克服的缺點(diǎn)。
近日,來(lái)自伯克利的研究人員們結(jié)合視覺(jué)研發(fā)出了一種新型的觸覺(jué)傳感器,并通過(guò)強(qiáng)化學(xué)習(xí)算法指導(dǎo)機(jī)器人準(zhǔn)確的定位并操作目標(biāo),在觸覺(jué)的幫助下實(shí)現(xiàn)了精確的控制。為了給機(jī)器人提供準(zhǔn)確的觸覺(jué)感知,研究人員利用柔性的硅膠和彩色LED燈制成了基于視覺(jué)的觸覺(jué)傳感器。通過(guò)采集物體與傳感器表面接觸造成的色彩變化圖像,來(lái)獲取觸覺(jué)信息。這種傳感器最大的優(yōu)勢(shì)在于可以直接通過(guò)視覺(jué)提供目標(biāo)的幾何信息,并可基于幾何信息推斷接觸力的大小。上圖中我們可以明顯的看到傳感器與管子接觸時(shí)產(chǎn)生的形變,這種形變與目標(biāo)外形可力相關(guān),并可以由傳感器上燈光色彩的視覺(jué)變化準(zhǔn)確的反映出來(lái)。
這與上圖中MIT之前的傳感器GelSight十分類似,都是基于光學(xué)手段來(lái)記錄下接觸造成的形變。利用這樣的傳感器可以幫助機(jī)器人尋找合適的抓取位置提高抓取成功率。
類似的觸覺(jué)傳感器GelSight
打造觸覺(jué)傳感器
在研究過(guò)程中,科研人員將觸覺(jué)傳感器安放到了下圖中三軸移動(dòng)平臺(tái)的末端執(zhí)行器上,傳感器的接觸面朝下以便與被測(cè)物體接觸。三軸平臺(tái)可在相對(duì)工作平面的xyz方向由步進(jìn)電機(jī)控制移動(dòng),在電機(jī)精度的幫助下這一平臺(tái)可以實(shí)現(xiàn)0.04mm的粗略精度,可有效地完成一系列精密操作。
傳感器被朝下安放在左上方的末端執(zhí)行器上。
研究人員對(duì)下面三個(gè)代表性的操作任務(wù)進(jìn)行了研究:1.重置小球位置:機(jī)器人通過(guò)傳感器表面的感知,將金屬小球移動(dòng)到目標(biāo)位置。難度主要在于對(duì)小球的控制力如果不準(zhǔn)確的話會(huì)造成它脫離傳感器和執(zhí)行器的控制,滾出控制平面。2.操作游戲手柄桿:游戲控制桿是我們進(jìn)行游戲操作的常見設(shè)備,觸覺(jué)在其中扮演了重要的角色。這一任務(wù)的特殊性在于搖動(dòng)搖桿時(shí)需要接觸-離開-再接觸的移動(dòng)過(guò)程來(lái)得到相應(yīng)的控制。3.滾骰子:這一任務(wù)的目標(biāo)是滾動(dòng)20面的篩子,在操作過(guò)程中十分容易劃出操作平面。不過(guò)這個(gè)任務(wù)的好處在于對(duì)應(yīng)的面有數(shù)字,可以通過(guò)光學(xué)傳感器看到對(duì)應(yīng)目標(biāo)面的數(shù)字。
三個(gè)任務(wù)的示意圖
上面的三個(gè)任務(wù)都是通過(guò)與觸覺(jué)相關(guān)的視覺(jué)目標(biāo)圖像來(lái)控制的,這意味著機(jī)器人的目標(biāo)在于操作物體在觸覺(jué)硅膠面上產(chǎn)生對(duì)應(yīng)的觸覺(jué)接觸圖樣,機(jī)器人基于這一圖像感知到物體的三維位姿并推測(cè)出需要的力。
深度觸覺(jué)模型預(yù)測(cè)控制
研究人員為了使用高維的圖像信息來(lái)指導(dǎo)上述的是三個(gè)任務(wù),提出了一套通用的強(qiáng)化學(xué)習(xí)算法——觸覺(jué)模型-預(yù)測(cè)控制(tactile MPC)。這套框架建立在先前視覺(jué)研究上,通過(guò)圖像預(yù)測(cè)任務(wù)的路徑和目標(biāo)位置。這三個(gè)任務(wù)可以使用同一套超參數(shù)來(lái)完成,無(wú)需人工調(diào)優(yōu)的參與。
深度觸覺(jué)預(yù)測(cè)控制模型的架構(gòu)圖
觸覺(jué)算法主要通過(guò)行為-條件視覺(jué)動(dòng)力學(xué)或自動(dòng)收集數(shù)據(jù)上的視頻預(yù)測(cè)模型進(jìn)行工作。模型從傳感器的原始像素中進(jìn)行學(xué)習(xí),基于機(jī)器人的預(yù)測(cè)動(dòng)作和背景觸覺(jué)圖像就能夠預(yù)測(cè)出未來(lái)的觸覺(jué)圖像,無(wú)需額外的位置傳感器或末端執(zhí)行器的輔助。
視覺(jué)預(yù)測(cè)模型架構(gòu)
為了訓(xùn)練一個(gè)通用的視覺(jué)預(yù)測(cè)模型,研究人員收集了豐富多樣的數(shù)據(jù),而這些數(shù)據(jù)很大程度上是機(jī)器人自己收集的。通過(guò)一些重置機(jī)制保證目標(biāo)不脫離工作臺(tái),機(jī)器人可以完全自主的收集數(shù)據(jù),記錄下瑞吉運(yùn)動(dòng)序列的軌跡,以及每一步對(duì)應(yīng)的位置和觸覺(jué)圖樣。對(duì)于上述的三個(gè)任務(wù)每一個(gè)需要花費(fèi)36h用于數(shù)據(jù)收集,但不需要人類的介入。
隨機(jī)數(shù)據(jù)的收集
下面展示了模型對(duì)于三個(gè)任務(wù)的表現(xiàn),輸入期望的目標(biāo)圖像模型將輸出一系列圖像序列軌跡來(lái)指導(dǎo)機(jī)器人移動(dòng)。
任務(wù)一:滾動(dòng)小球的操作
任務(wù)二:操作游戲搖桿
任務(wù)三:滾動(dòng)篩子
可以看到對(duì)于不同的任務(wù)可以使用同一套超參數(shù)獲取達(dá)到目標(biāo)的軌跡序列,證明這套模型具有較強(qiáng)的通用性。研究人員通過(guò)這種新型傳感器和視覺(jué)預(yù)測(cè)模型的方法解決了機(jī)器人控制中的觸覺(jué)問(wèn)題,為復(fù)雜物體的操作提供了新的思路,未來(lái)工作將會(huì)拓展到更為復(fù)雜的操作任務(wù)和通用部件的位置控制及裝配上。
-
傳感器
+關(guān)注
關(guān)注
2565文章
53008瀏覽量
767467 -
機(jī)器人
+關(guān)注
關(guān)注
213文章
29748瀏覽量
212889
原文標(biāo)題:伯克利提出新型傳感器,為機(jī)器人賦予靈敏觸覺(jué)
文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論