隨著技術(shù)的迭代,人工智能正在快速?gòu)慕鉀Q “具體問(wèn)題” 的弱人工智能向解決 “通用問(wèn)題” 的強(qiáng)人工智能演進(jìn)。
在這個(gè)過(guò)程之中,人工智能想要獲得同人類(lèi)一樣的解決問(wèn)題的能力,必須具備與人類(lèi)相似的 “知識(shí)架構(gòu)”。有了這個(gè)基礎(chǔ),人工智能不僅可以做到 “共情”,甚至可以對(duì)人類(lèi)行為或事態(tài)的發(fā)展進(jìn)行一定程度的 “預(yù)判”。
初窺預(yù)言 “水晶球”
10 月 15 日,來(lái)自北卡羅來(lái)納大學(xué)教堂山分校的博士生雷杰在 arXiv 上傳了一篇名為 “What is More Likely to Happen Next? Video-and-Language Future Event Prediction” 的預(yù)印本論文,這篇論文的內(nèi)容提出并初步實(shí)現(xiàn)了讓 AI 預(yù)測(cè)事態(tài)未來(lái),目前該論文已經(jīng)被 EMNLP2020 接收。
雷杰告訴 DeepTech,前幾年業(yè)內(nèi)關(guān)注的研究重點(diǎn)都在于機(jī)器如何 “理解” 視頻的內(nèi)容,而他們的工作對(duì)于業(yè)內(nèi)來(lái)說(shuō)算是在新領(lǐng)域進(jìn)行了些許拓荒,為加強(qiáng)和測(cè)試模型的事件預(yù)測(cè)能力及常識(shí)認(rèn)知能力提供了一個(gè)新的方向。
他們的項(xiàng)目名為 “VideoLanguageFuturePrediction”,其中 Video 指視頻,而 Language 指視頻中對(duì)話(huà)的文本,可以理解為 “字幕”。一次完整的預(yù)測(cè)流程大概是這樣:
將視頻 + 字幕 + 兩種人類(lèi)給出的未來(lái)可能方向 A 和 B,輸入模型,模型將輸出它的判斷結(jié)果,即 A 和 B 各自發(fā)生的概率。通過(guò)這種做 “選擇題” 的方式實(shí)現(xiàn)一定程度的 “預(yù)測(cè)”。
圖 | VideoLanguageFuturePrediction 數(shù)據(jù)流程圖
雷杰補(bǔ)充道,這是一種比較初步的解決方案,未來(lái) AI 將能夠做 “閱讀理解”,即直接從給定的視頻和字幕之中自己生成對(duì)未來(lái)的預(yù)測(cè)。當(dāng)然,不管是 “選擇題” 還是 “閱讀理解”,都需要 AI 具備一定的理解能力。
同時(shí),雷杰和同事也暫未加入讓 AI 給出決策理由的功能。他說(shuō),這項(xiàng)能力可以單獨(dú)作為一個(gè)比較復(fù)雜的研究課題,所以他們暫時(shí)聚焦于 “預(yù)測(cè)” 這件事。
為了訓(xùn)練這個(gè)模型,雷杰和同事準(zhǔn)備了 2.8 萬(wàn)個(gè)用例,并將其命名為 “VLEP(Video-and-Language Event Prediction)”。
這批視頻數(shù)據(jù)分成兩類(lèi),電視節(jié)目以及來(lái)自 YouTube 的 Vlog。
圖 | 視頻素材統(tǒng)計(jì)
他們首先將這些視頻進(jìn)行預(yù)處理,最終它們被切割為一個(gè)個(gè) 60 到 90 秒的片段。之后將這批素材提交到數(shù)據(jù)標(biāo)注平臺(tái)進(jìn)行人工標(biāo)注。人類(lèi)將標(biāo)注短視頻內(nèi) “事件” 的起止時(shí)間,并且給出兩個(gè)預(yù)測(cè)結(jié)果 —— 未來(lái)較大可能發(fā)生的和較小可能發(fā)生的。
雷杰說(shuō),假如視頻中顯示一個(gè)人拿起杯子,那么按照常理推斷,他更可能要喝水,而不是將杯子摔碎?!斑@種人類(lèi)非常容易完成的事情,對(duì)機(jī)器來(lái)說(shuō)并不簡(jiǎn)單。”
未來(lái),他們將嘗試結(jié)合大規(guī)模視頻數(shù)據(jù)進(jìn)行一些無(wú)監(jiān)督學(xué)習(xí),讓模型能夠加深對(duì)視頻和字幕的理解,并建立像人類(lèi)一樣的 “關(guān)聯(lián)”。
談及應(yīng)用,雷杰坦言,目前他們的研究仍然處于比較早期的階段,但他認(rèn)為未來(lái)人工智能必將具備同人類(lèi)一樣的 “知識(shí)架構(gòu)”,它們將更加懂得人類(lèi)的想法,同人類(lèi)的合作也會(huì)更加 “心有靈犀”。
更喜歡 “確定性”
雷杰 2013 年考入坐落于成都的電子科技大學(xué),大學(xué)二年級(jí)他憑借優(yōu)異成績(jī)?nèi)雵藘H接收年級(jí)前 5% 學(xué)生的 “英才實(shí)驗(yàn)學(xué)院”,在這里,雷杰接受了較同齡人更為全面、系統(tǒng)性的計(jì)算機(jī)教育。
雖然他現(xiàn)在的研究方向?qū)9?“人工智能”,但其實(shí)雷杰最早報(bào)考的是微電子專(zhuān)業(yè),入學(xué)之后才轉(zhuǎn)到了計(jì)算機(jī)。
對(duì)此他解釋道,“小的時(shí)候我非常喜歡鼓搗電子元器件,所以高考選擇了這個(gè)專(zhuān)業(yè),但當(dāng)我設(shè)計(jì)的正確電路因?yàn)榇植诘墓に嚩r(shí),我的內(nèi)心動(dòng)搖了。” 經(jīng)過(guò)一段時(shí)間的自我審視,他發(fā)現(xiàn)自己更加傾向于 “1 + 1 = 2” 這類(lèi)嚴(yán)格規(guī)整、且確定性的東西,便義無(wú)反顧地投身到計(jì)算機(jī)科學(xué)之中。
大一結(jié)束時(shí),雷杰在同一位博士學(xué)長(zhǎng)交流的過(guò)程中第一次聽(tīng)到了 “機(jī)器學(xué)習(xí)” 這個(gè)概念,這讓他感到非常震驚。是的,機(jī)器為什么不能 “學(xué)習(xí)” 呢?
在好奇心的驅(qū)使下,他開(kāi)始孜孜不倦地學(xué)習(xí)相關(guān)知識(shí),并最終選擇留學(xué)攻讀相關(guān)領(lǐng)域的博士學(xué)位。
原文標(biāo)題:AI窺見(jiàn)未來(lái)?四川小伙兒發(fā)明預(yù)言 “水晶球”
文章出處:【微信公眾號(hào):DeepTech深科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:haq
-
AI
+關(guān)注
關(guān)注
88文章
35164瀏覽量
279947 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134620
原文標(biāo)題:AI窺見(jiàn)未來(lái)?四川小伙兒發(fā)明預(yù)言 “水晶球”
文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論