德國伯恩大學的研究人員設(shè)計了一個軟件,能夠看視頻并預測未來5分鐘會發(fā)生的事件,準確率在15%到40%之間。研究人員表示,對于具有大量不同動作的長視頻,他們的方法也能夠準確預測未來,甚至可以處理嘈雜或錯誤的輸入信息。
從幾百萬年前起,第一個原始人類仰望星空,對宇宙產(chǎn)生好奇開始,我們?nèi)祟悓χ茉馐澜绲睦斫夂桶芽?,已?jīng)達到了相當嫻熟的程度。
我們已經(jīng)可以超音速飛行,可以轉(zhuǎn)基因,還能治療癌癥。但是,有一件事情是我們一直沒有做得很好的,那就是對“時間”的感知——如何從當下推斷未來,如何最大限度的利用這種推測?
現(xiàn)在看,機器似乎可以幫助我們做到這一點。
德國波恩大學的計算機科學家設(shè)計出了一種軟件,能夠預測未來5分鐘的序列事件,準確率在15%到40%之間。
雖然從數(shù)值上看,這個精度并不高,但研究人員Juergen Gall表示,這代表了機器學習超越了單步預測(single-step prediction),向新的領(lǐng)域邁進了一步。相關(guān)的研究論文已經(jīng)被CVPR 2018接收。
Juergen Gall團隊展示他們的預測未來系統(tǒng)
超越單步預測
Gall和他同事們的研究目標——教會計算機預測未來——并不是現(xiàn)在才有,實際上,這是機器學習和計算機視覺領(lǐng)域的一個主要課題,有大量的研究人員都在從事相關(guān)的工作。
但是,這項工作特殊的地方在于其方法:到目前為止,這些領(lǐng)域的研究集中在對當前行動的解釋,或者對預期的下一步行動進行預測上面,也即前面提到的“單步預測”。
單步預測,也就是預測未來往前一步的結(jié)果。這是預測未來模式的基礎(chǔ),歸結(jié)為一個回歸問題,輸入變量,預測結(jié)果。
在進行這樣的預測時,目前的研究已經(jīng)取得了比較好的結(jié)果。其中一個例子是,斯坦福大學吳恩達團隊設(shè)計了一種深度學習算法,在對臨終關(guān)懷的預測中,實現(xiàn)了高達90%的準確性。
在他們的實驗中,斯坦福的研究人員使用了200萬份病歷對他們設(shè)計的神經(jīng)網(wǎng)絡進行訓練,通過這些數(shù)據(jù),網(wǎng)絡能夠發(fā)現(xiàn)醫(yī)生發(fā)現(xiàn)不了的模式和規(guī)律,并以此為基礎(chǔ),對新的病人的情況(患者在接下來3~12個月內(nèi)的死亡率)進行預測。
這項研究面臨的變量十分復雜,而且取得了很高的精度,論文也獲得了IEEE生物信息學和生物醫(yī)學組最佳學生論文獎。但是,這樣的算法是基于過往(retrospective),而且只進行單步預測。
多步預測:用CNN和RNN預測未來的兩種結(jié)構(gòu)
在Gall和他團隊的最新研究中,他們提出了兩種方法,對相當長時間的未來發(fā)生的大量行動進行預測。他們訓練了一個CNN和一個RNN,根據(jù)之前看過的視頻內(nèi)容,學習未來視頻的“標簽”。
“我們表明,即使對于具有大量不同動作的長視頻,我們的方法也能夠準確預測未來,甚至可以處理嘈雜或錯誤的輸入信息?!弊髡咴谡撐闹羞@樣寫道。
下面的圖例展示了研究人員設(shè)計的兩個方法。首先來看RNN的設(shè)計。
在RNN系統(tǒng)的結(jié)構(gòu)中,輸入是一個序列,網(wǎng)絡預測最近觀察到的動作的剩余長度,以及下一個動作的標簽和長度。將預測結(jié)果附加到原始輸入,就可以預測下一個動作片段。
而在CNN系統(tǒng)的結(jié)構(gòu)中,輸入序列和輸出序列都被轉(zhuǎn)換成矩陣的形式。其中,C表示類(class)的數(shù)量,S則對應于特定長度的視頻片段的數(shù)量。矩陣的二進制值表示每個視頻片段的標簽。
讓機器預測長時間的未來,有望實現(xiàn)真正的人機協(xié)作
在他們的實驗中,Gall和他的團隊使用數(shù)小時的視頻數(shù)據(jù)來演示不同的烹飪動作(例如煎雞蛋、拌沙拉等),并僅向軟件展示其中的一部分動作。軟件根據(jù)“已經(jīng)學到的”來預測接下來的動作步驟。通過這種方法,Gall希望該領(lǐng)域能夠向真正的人機共生邁進一步。
“[業(yè)界]人們談論人類和機器人協(xié)作,但最終人和機器之間仍存在分離; 他們并沒有真正密切地合作,”Gall說。
Gall建議說,通過使用適當?shù)挠布?,這個軟件可以通過直觀地了解任務來幫助人類完成任務,進而在工業(yè)環(huán)境中幫助人類工作。
Gall說:“老年人越來越多,值得努力在家庭中推廣這種機器人來照顧老年人,”Gall說: “我相信10年后服務機器人將能夠在家照顧老年人?!?/p>
根據(jù)人口統(tǒng)計局的報告,今天65歲以上的美國人的數(shù)量約為4600萬,預計到2060年將翻一番。根據(jù)2014年美國疾病控制與預防中心(CDC)的報告,這些老年人中約140萬將生活在養(yǎng)老院。日本已經(jīng)探索過使用這樣的軟件帶來的影響。例如用于療愈的海豹型機器然PARO,軟銀的伴侶機器人Pepper等。在日本,四分之一人口是老年人。
隨著這類技術(shù)的進步,或許會在人類代際之間造成進一步的分化——把愛和關(guān)懷外包給一臺機器。對于一個尚未成熟的行業(yè)來說,很難說這條路將通向何方,但最終決定權(quán)掌握在開發(fā)人員手中,而不是掌握在他們開發(fā)的軟件或機器人手中。
-
機器人
+關(guān)注
關(guān)注
213文章
29726瀏覽量
212810 -
計算機視覺
+關(guān)注
關(guān)注
9文章
1708瀏覽量
46770 -
機器學習
+關(guān)注
關(guān)注
66文章
8501瀏覽量
134580
原文標題:機器也能感知時間,AI系統(tǒng)可預測5分鐘內(nèi)的未來!
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
未來10年新產(chǎn)品演變預測:耳塞可做鬧鐘
2016年VR行業(yè)發(fā)展狀況及未來五年預測
云計算未來的三個預測
未來酒店——建設(shè)高效研發(fā)團隊的經(jīng)驗分享
光伏功率預測系統(tǒng)的構(gòu)成和作用
模型預測控制介紹
HarmonyOS/OpenHarmony生態(tài)發(fā)展帶來的全新職業(yè)預測
【鄭州輕工業(yè)大學】HarmonyOS寵物健康系統(tǒng)的開發(fā)分享
預測汽車的未來 將會變成怎樣?
回顧2017年對未來的預測
未來五年關(guān)于智能市場的十大預測
光伏功率預測系統(tǒng)軟件架構(gòu)及構(gòu)成原理

評論