一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

當(dāng)前的AI還不擅長處理哪些種類的問題?

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-10-13 09:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編者按:數(shù)據(jù)科學(xué)家Shayaan Jagtap以馬里奧和精靈寶可夢為例,解釋了當(dāng)前的AI還不擅長處理哪些種類的問題。

你大概早就聽說機(jī)器能以超人的水平玩游戲。這些機(jī)器可能經(jīng)過明確編程,對(duì)設(shè)定的輸入作出反應(yīng),給出設(shè)定的輸出,也可能自行學(xué)習(xí)演化,以不同的方式對(duì)相同的輸入作出反應(yīng),希望找到最優(yōu)的反應(yīng)。

一些著名的例子:

AlphaZero,24小時(shí)訓(xùn)練之后,成為地球上最強(qiáng)大的國際象棋選手。

AlphaGo,著名的圍棋機(jī)器人,擊敗了世界級(jí)棋手李世乭和柯潔。

MarI/O,可自行學(xué)習(xí)以任意等級(jí)進(jìn)行游戲的超級(jí)馬里奧機(jī)器人。

這些游戲很復(fù)雜,訓(xùn)練上面的機(jī)器需要精心組合復(fù)雜的算法,反復(fù)模擬,大量時(shí)間。本文將重點(diǎn)討論MarI/O,以及為何我們無法使用相似的方法通關(guān)精靈寶可夢游戲。

在這方面,馬里奧和精靈寶可夢有三個(gè)關(guān)鍵不同:

目標(biāo)數(shù)量

分支因子

全局優(yōu)化與局部優(yōu)化

目標(biāo)數(shù)量

機(jī)器學(xué)習(xí)的方式是優(yōu)化某種目標(biāo)函數(shù)。不管它是最大化獎(jiǎng)勵(lì)函數(shù)(強(qiáng)化學(xué)習(xí))、適應(yīng)度函數(shù)(遺傳算法),還是最小化代價(jià)函數(shù)(監(jiān)督學(xué)習(xí)),目標(biāo)都是類似的:取得盡可能好的分?jǐn)?shù)。

馬里奧只有一個(gè)目標(biāo):到達(dá)本級(jí)別的終點(diǎn)。簡單來說,在死亡之前,到達(dá)的地方越靠右,表現(xiàn)就越好。這是一個(gè)單一的目標(biāo)函數(shù),模型的能力可以由這一個(gè)數(shù)字直接衡量。

精靈寶可夢的目標(biāo)……有很多。擊敗精英4級(jí)?捕獲所有寶可夢?訓(xùn)練最強(qiáng)團(tuán)隊(duì)?上面所有這些?還是其他完全不同的目標(biāo)?

我們不僅需要定義什么是最終目標(biāo),還要定義進(jìn)展看起來是什么樣的?這樣,任意時(shí)刻,大量可能選擇之中的每種行動(dòng)才能和獎(jiǎng)勵(lì)或損失對(duì)應(yīng)起來。

這引出了下一項(xiàng)主題。

分支因子

簡單說,分支因子是任意一步可以做出的可能選擇數(shù)量。國際象棋的分支因子平均是35,圍棋是250. 額外考慮的未來每一步,都有(分支因子)步數(shù)項(xiàng)選擇需要評(píng)估。

馬里奧中,要么向左,要么向右,要么起跳,要么什么也不做。機(jī)器需要評(píng)估的選擇數(shù)很小。同時(shí),從算力上說,分支因子越小,機(jī)器人可以預(yù)計(jì)的步數(shù)就越多。

精靈寶可夢則是一個(gè)開放世界游戲,這意味著,任意給定時(shí)刻都有大量選擇。簡單的向上、向下、向左、向右無法有效計(jì)算分支因子數(shù)量。相反,我們需要查看下一個(gè)有意義的行動(dòng)。下一個(gè)行動(dòng)是進(jìn)入戰(zhàn)斗,和NPC交談,還是進(jìn)入左/右/上/下方的小地圖?隨著游戲的進(jìn)行,可能的選擇范圍越來越大。

創(chuàng)建一個(gè)可以找到最佳選擇組合的機(jī)器,需要考慮短期和長期目標(biāo),這引出了最后一項(xiàng)主題。

全局優(yōu)化與局部優(yōu)化

局部優(yōu)化與全局優(yōu)化既包括空間層面,也包括時(shí)間層面。短期目標(biāo)和周圍地理區(qū)域?qū)儆诰植?,長期目標(biāo)和城市、全地圖這樣較大的區(qū)域?qū)儆谌帧?/p>

拆分每一步可以是一種分解精靈寶可夢問題的方式。如何從A點(diǎn)到B點(diǎn)的局部優(yōu)化是容易的,但決定哪個(gè)目的地是最優(yōu)的B點(diǎn)則是一個(gè)困難得多的問題。貪心算法在這里無法奏效,因?yàn)榫植孔顑?yōu)的決策不一定導(dǎo)向全局最優(yōu)。

馬里奧地圖很小,而且是線性的。而精靈寶可夢卻有著錯(cuò)綜復(fù)雜的非線性大地圖。為了達(dá)到高階目標(biāo),當(dāng)前優(yōu)先級(jí)會(huì)隨著時(shí)間而改變,將全局目標(biāo)轉(zhuǎn)換為優(yōu)先局部優(yōu)化問題不是一項(xiàng)容易的任務(wù)。這不是我們當(dāng)前的模型具有足夠能力可以處理的事情。

最后一點(diǎn)

從機(jī)器人的角度來說,精靈寶可夢不是一個(gè)游戲。機(jī)器人都是專門的,當(dāng)你遭遇要戰(zhàn)斗的NPC時(shí),幫助你在地圖上移動(dòng)的機(jī)器人對(duì)此束手無策——這是兩個(gè)完全不同的任務(wù)。

在戰(zhàn)斗階段,每個(gè)回合有許多選項(xiàng)。選擇如何移動(dòng),切換到哪個(gè)寶可夢,何時(shí)使用不同的物品,本身就是一個(gè)復(fù)雜的優(yōu)化問題。我看到過一篇介紹如何創(chuàng)建戰(zhàn)斗模擬器的文章,考慮得很周到,在沒有考慮物品使用這一決定戰(zhàn)斗結(jié)果的關(guān)鍵因素的前提下,復(fù)雜度已經(jīng)高得驚人了。

目前,我們能夠創(chuàng)造出能夠在我們自己的游戲中戰(zhàn)勝我們的機(jī)器人,我們該為此感到高興。這些游戲在數(shù)學(xué)上很復(fù)雜,但在目標(biāo)上很簡單。隨著AI技術(shù)的進(jìn)展,我們將創(chuàng)造能夠解決有越來越大影響力的真實(shí)世界問題的機(jī)器人,這些機(jī)器人將通過自行學(xué)習(xí)復(fù)雜優(yōu)化問題來解決真實(shí)世界問題??梢苑判牡氖牵€是有很多事情我們要比機(jī)器更擅長,其中包括我們童年時(shí)玩的游戲——至少到目前為止是這樣。感謝閱讀!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29735

    瀏覽量

    212859
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35136

    瀏覽量

    279775
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4381

    瀏覽量

    64862

原文標(biāo)題:為什么AI可以通關(guān)馬里奧,卻玩不好精靈寶可夢?

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    觸控按鍵之無須做特別的絕緣處理

    `觸控按鍵之無須做特別的絕緣處理你的觸控按鍵還需做特別處理絕緣問題嗎?女生一般對(duì)電器之類的都比較不擅長,特別是沒有把 絕緣處理好的情況下,更加不敢碰,深圳市沃邇瑪電子有限公司生產(chǎn)的觸控
    發(fā)表于 09-13 09:49

    CPU和GPU擅長不擅長的地方

    不擅長”。 芯片的速度主要取決于三個(gè)方面:微架構(gòu)、主頻、IPC(每個(gè)時(shí)鐘周期執(zhí)行的指令數(shù))。 1.微架構(gòu)從微架構(gòu)上看,CPU和GPU看起來完全不是按照相同的設(shè)計(jì)思路設(shè)計(jì)的,當(dāng)代CPU的微架構(gòu)是按照兼顧
    發(fā)表于 12-03 15:43

    CPU和GPU擅長不擅長的地方

    不擅長”。芯片的速度主要取決于三個(gè)方面:微架構(gòu)、主頻、IPC(每個(gè)時(shí)鐘周期執(zhí)行的指令數(shù))。1.微架構(gòu)從微架構(gòu)上看,CPU和GPU看起來完全不是按照相同的設(shè)計(jì)思路設(shè)計(jì)的,當(dāng)代CPU的微架構(gòu)是按照兼顧“指令
    發(fā)表于 12-03 20:08

    AD蛇形布線和等長處理技巧

    添加類:做等長處理的往往是多根線,需要將多根線歸成一類,設(shè)置netclass方法如下:在原理圖中:Place-directives-BlanketPlace-directives-NetClass標(biāo)記結(jié)果如下:僅作參考,比如將電源歸位電源類
    發(fā)表于 05-24 08:57

    請問電路分析不擅長該怎么抄板?

    電路分析不擅長,怎么抄板,有沒有大師分享點(diǎn)經(jīng)驗(yàn)
    發(fā)表于 07-03 05:35

    什么是數(shù)字信號(hào)處理器性價(jià)比的新標(biāo)桿?

    很強(qiáng)的數(shù)據(jù)處理能力,然而系統(tǒng)必要的控制功能是DSP所不擅長的。什么是數(shù)字信號(hào)處理器性價(jià)比的新標(biāo)桿?我們需要注意什么?
    發(fā)表于 08-02 07:25

    為什么AI設(shè)計(jì)師要特別區(qū)分:相關(guān)性 VS. 因果性呢?

    最低(最佳)的組合(解)。 AI設(shè)計(jì)師很清楚:AI擅長找規(guī)律,但不擅長找正確(最佳)解,能有80%準(zhǔn)確度就很棒了,所以AI設(shè)計(jì)師跳出傳統(tǒng)程式
    發(fā)表于 11-26 10:21

    詮釋AI的兩大特征:黑盒子與不確定性

    for Uncertainty in Artificial Intelligence,簡稱AUAI)。并且定期召開大型會(huì)議,研討各種可能的解決途徑。 5.2 AI不擅長<不確定性>
    發(fā)表于 11-26 10:45

    芯片的速度取決于哪幾個(gè)方面?

    芯片的速度取決于哪幾個(gè)方面?CPU和GPU擅長不擅長的地方看了就知道
    發(fā)表于 04-06 09:05

    探討一下用于單片機(jī)的幾種C語言算法

    單片機(jī)主要作用是控制外圍的器件,并實(shí)現(xiàn)一定的通信和數(shù)據(jù)處理。雖然單片機(jī)不擅長實(shí)現(xiàn)算法和進(jìn)行復(fù)雜...
    發(fā)表于 02-25 07:21

    現(xiàn)在的人工智能系統(tǒng)是怎樣的狀態(tài)

    所謂窄AI,是指那些特別擅長處理單一任務(wù)或者特定范圍內(nèi)工作的系統(tǒng)。
    發(fā)表于 04-22 17:41 ?1778次閱讀

    為什么大多數(shù)流行的目標(biāo)檢測模型不擅長檢測小目標(biāo)?

    ”世界,但跟我們不一樣。為了像我們?nèi)祟愐粯涌吹胶妥R(shí)別每個(gè)物體,它們必須特別地進(jìn)行檢測和分類。雖然所有現(xiàn)代檢測模型都非常擅長檢測相對(duì)較大的物體,比如人、汽車和樹木,但另一方面,小物體仍然給它們帶來一些麻煩。對(duì)于一
    的頭像 發(fā)表于 06-09 17:50 ?2522次閱讀

    擅長PCB畫板但不擅長APP開發(fā),如何才能克服不足,將家用電器改造成智能電器呢?

    正所謂術(shù)業(yè)有專攻,自從踏入電子信息這領(lǐng)域,從大學(xué)主攻模電數(shù)電,到上班后畫PCB、做EMC測試等等,我在硬件工程師的路上越走越遠(yuǎn)了,在計(jì)算機(jī)領(lǐng)域的Java、Swift等等語言,了解的也少了,更是不擅長
    的頭像 發(fā)表于 03-17 10:50 ?858次閱讀
    我<b class='flag-5'>擅長</b>PCB畫板但<b class='flag-5'>不擅長</b>APP開發(fā),如何才能克服不足,將家用電器改造成智能電器呢?

    蘋果發(fā)布研究論文:揭示Ferret-UI AI系統(tǒng),破解MLLMs移動(dòng)應(yīng)用理解難題

    目前圍繞人工智能(AI)技術(shù),出現(xiàn)了如ChatGPT這樣的大語言模型(LLMs),這些模型擅長處理文本資料。然而,對(duì)于像圖片、視頻和聲音等多媒體類型的非文本n內(nèi)容,就需要擴(kuò)大AI模型的適用范圍,相應(yīng)地,多模態(tài)大語言模型(MLLM
    的頭像 發(fā)表于 04-10 10:17 ?646次閱讀

    李開復(fù):中國擅長打造經(jīng)濟(jì)實(shí)惠的AI推理引擎

    10月22日上午,零一萬物公司的創(chuàng)始人兼首席執(zhí)行官李開復(fù)在與外媒的交流中透露,其公司旗下的Yi-Lightning(閃電模型)在推理成本上已實(shí)現(xiàn)了顯著優(yōu)勢,比OpenAI的GPT-4o模型低了31倍。他強(qiáng)調(diào),中國擅長打造經(jīng)濟(jì)實(shí)惠的AI推理引擎,這是推動(dòng)
    的頭像 發(fā)表于 10-22 16:54 ?732次閱讀