一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能玩家發(fā)明自己的“語(yǔ)言”,合作“交流”以贏得紙牌游戲

IEEE電氣電子工程師 ? 來(lái)源:lp ? 2019-03-10 11:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機(jī)器正變得越來(lái)越具有協(xié)作性,其中既包括機(jī)器與人的協(xié)作也包括機(jī)器與機(jī)器之間的協(xié)作。不久之后,我們可能就會(huì)有能協(xié)商通行權(quán)的自動(dòng)駕駛汽車,以及協(xié)助護(hù)士進(jìn)行家庭護(hù)理的機(jī)器人。但首先,它們需要學(xué)會(huì)交流,而且不僅僅是通過(guò)言語(yǔ)交流。人類用他們的行動(dòng)說(shuō)了很多。踩剎車不僅會(huì)讓你減速,還預(yù)示著前方可能有麻煩。雙臂交叉在胸前既可以保護(hù)你,又傳達(dá)出沉默的信號(hào)。

為了教會(huì)人工智能AI)進(jìn)行交流,研究人員轉(zhuǎn)向了紙牌游戲。雖然人工智能很久以前就在國(guó)際象棋、圍棋、某些形式的撲克和許多電子游戲中擊敗了人類,但橋牌和花火(Hanabi)等游戲提供了一些特殊的挑戰(zhàn)。玩家必須在沒(méi)有明確的信息共享方式的情況下進(jìn)行合作(例如打出對(duì)方需要你打出的牌)。研究這兩款游戲的研究人員最近開發(fā)了一些人工智能系統(tǒng),這些系統(tǒng)發(fā)明了自己的隱式代碼來(lái)協(xié)調(diào)它們的動(dòng)作。

在橋牌比賽中,有四名選手,分成兩隊(duì)。在任何人出牌之前,玩家可以輪流叫牌。用選定的作為將牌的花色叫牌來(lái)表明你認(rèn)為你的團(tuán)隊(duì)可以贏某個(gè)墩數(shù)。多年來(lái),橋牌玩家們已經(jīng)開發(fā)出了很多能同時(shí)讓隊(duì)友知道自己手里有什么排的叫牌方法。例如,一個(gè)人可能叫“兩個(gè)梅花”(即使他沒(méi)有梅花)來(lái)表示自己手里有很多花牌(J、Q、K)。通過(guò)這樣編碼過(guò)的叫牌,團(tuán)隊(duì)可以進(jìn)行基本的對(duì)話。

倫敦大學(xué)學(xué)院(University College London)的研究人員最近在預(yù)印本文庫(kù)arXiv上發(fā)表了一篇標(biāo)題為“Learning to Communicate Implicitly By Actions”的論文。在他們的名為“策略-信念-迭代”(Policy - Belief - Iteration,簡(jiǎn)稱P-BIT)的系統(tǒng)中,每個(gè)AI玩家都有兩個(gè)神經(jīng)網(wǎng)絡(luò)。一個(gè)網(wǎng)絡(luò)學(xué)習(xí)根據(jù)叫牌來(lái)推斷隊(duì)友手里有什么牌。另一個(gè)學(xué)習(xí)根據(jù)對(duì)隊(duì)友手里有的牌的推斷和自己手里的牌來(lái)做出恰當(dāng)?shù)慕信?。在?xùn)練過(guò)程中,AI玩家會(huì)因?yàn)樽约旱慕信铺岣吡岁?duì)友所做推斷(推斷自己手里有什么牌)的準(zhǔn)確性而得到獎(jiǎng)勵(lì)。

在經(jīng)過(guò)150萬(wàn)手的練習(xí)之后,這對(duì)AI搭檔已經(jīng)發(fā)展出了它們自己的約定,比如用叫一種花色的三張牌的方式來(lái)表明這種花色的六張牌可能是一個(gè)理想的定約。這對(duì)AI玩家擊敗了沒(méi)有進(jìn)行交流或?qū)λ鼈冴?duì)友的信念進(jìn)行建模的基線AI玩家。該論文的作者之一、倫敦大學(xué)學(xué)院的計(jì)算機(jī)科學(xué)家Jun Wang表示,這些AI玩家還無(wú)法與人類玩家相比,但他發(fā)現(xiàn)初步結(jié)果“是非常鼓舞人心的”。

一款名為花火(Hanabi)的新型紙牌游戲也具有類似的交流挑戰(zhàn)。在這款需要合作的類單人紙牌游戲中,兩到五名玩家每人各持有四到五張牌,每張牌都具有一種顏色并帶有一個(gè)數(shù)字,玩家需要輪流將它們按正確的順序放到彩色的紙牌堆上。但他們看不到自己的牌,只能看到隊(duì)友的牌。

在每個(gè)回合中,他們可以出一張牌、丟棄一張牌,或者給另一位玩家一個(gè)提示。他們不能告訴對(duì)方可以出哪張牌,而是只能說(shuō)對(duì)方手中的哪些牌是某種顏色的或是帶有某個(gè)數(shù)字的。在某些情況下,指出隊(duì)友手中的某張牌的顏色,可能是向隊(duì)友示意他接下來(lái)應(yīng)該打出這一張牌。信息不僅可以來(lái)自顯性線索本身(牌的顏色),還可以來(lái)自為什么選擇該線索而不是其他線索的隱性內(nèi)容。

最近,DeepMind Technologies和牛津大學(xué)的一個(gè)團(tuán)隊(duì)在arXiv上發(fā)表了一篇標(biāo)題為“Bayesian Action Decoder for Deep Multi-Agent Reinforcement Learning”的論文。論文中介紹了一個(gè)針對(duì)雙人版本花火游戲的機(jī)器學(xué)習(xí)系統(tǒng)。他們的“貝葉斯動(dòng)作解碼器”(Bayesian Action Decoder,簡(jiǎn)稱BAD)也使用神經(jīng)網(wǎng)絡(luò),讓每個(gè)人工智能玩家嘗試推斷其隊(duì)友的信念。為了避免無(wú)限遞歸地思考你的隊(duì)友在思考你在思考什么,這個(gè)系統(tǒng)兩個(gè)玩家外部創(chuàng)建了一套“公共信念”。

這些公共信念代表了有關(guān)游戲狀態(tài)和之前動(dòng)作的所有公開可用信息,以及在沒(méi)有實(shí)際查看其中任何一手的情況下可能說(shuō)的關(guān)于所有手的話。然后,“公共代理人”使用神經(jīng)網(wǎng)絡(luò)將這些信念轉(zhuǎn)換為關(guān)于每個(gè)玩家應(yīng)該做什么以及他們的隊(duì)友手中可能拿著怎樣的牌的指示。然后,每個(gè)玩家在公共代理的指導(dǎo)下,根據(jù)自己的觀察,采取行動(dòng)。

盡管這些人工智能玩家并沒(méi)有因?yàn)榻涣鞫@得特別的獎(jiǎng)勵(lì),但打信號(hào)卻產(chǎn)生了另外的作用。例如,指出紅牌或黃牌意味著AI隊(duì)友應(yīng)該打出最近抽到的牌。研究人員計(jì)算出,通過(guò)暗示分享的信息中有40%是隱性的。這種編碼通信幫助他們的系統(tǒng)近乎完美地運(yùn)行,平均得分為24分(滿分25分),比之前最好的機(jī)器人高出約1分。(對(duì)于人類來(lái)說(shuō),即使有使用肢體語(yǔ)言的不公平優(yōu)勢(shì),得分超過(guò)20分就是不錯(cuò)的。)

這兩個(gè)系統(tǒng),即用于橋梁的P-BIT和用于Hanabi的BAD,都依賴于給予人工智能的一些東西,比如人的“心理理論”,或者對(duì)他人的信念和意圖的認(rèn)知。這種推理在人際交往中普遍存在。如果你問(wèn)你的朋友他的婚姻狀況,而他把話題轉(zhuǎn)到紐約大都會(huì)隊(duì),那么他的話就不僅說(shuō)明了關(guān)于大都會(huì)隊(duì)的一些情況,也說(shuō)明了他的婚姻狀況。

為了讓AI能夠高效、優(yōu)雅地處理與人之間或彼此之間的互動(dòng),它們需要理解隱性信號(hào),而紙牌游戲是實(shí)現(xiàn)目標(biāo)的途徑之一。一家名為NukkAI的創(chuàng)業(yè)公司專注于為橋牌打造更好的人工智能,并且正籌集了數(shù)百萬(wàn)美元,期望最終將其技術(shù)應(yīng)用于現(xiàn)實(shí)世界的問(wèn)題。在最近的一篇標(biāo)題為“The Hanabi Challenge: A New Frontier for AI Research”論文中,DeepMind稱花火為“人工智能研究的一個(gè)新前沿”,并提供了一個(gè)開源測(cè)試平臺(tái)。

盡管DeepMind的BAD系統(tǒng)通過(guò)反復(fù)與同一隊(duì)友玩游戲來(lái)制定出約定,但他們?cè)谏厦婺瞧撐闹兄赋?,更高?jí)的任務(wù)將是對(duì)不熟悉的玩家的行為進(jìn)行動(dòng)態(tài)推理。他們?cè)谶@個(gè)場(chǎng)景下測(cè)試了一些系統(tǒng),而沒(méi)有一個(gè)系統(tǒng)的平均得分超過(guò)4分。

研究機(jī)器人和通信的康奈爾大學(xué)計(jì)算機(jī)科學(xué)家Julia Proft也強(qiáng)調(diào)了即時(shí)推理的重要性。她最近發(fā)現(xiàn),當(dāng)AI花火玩家使用隱性信號(hào)時(shí),它們更有可能被判斷為是人類玩家。這一發(fā)現(xiàn)發(fā)表在標(biāo)題為“Implicit Communication of Actionable Information in Human-AI teams”的論文中。在談到關(guān)于習(xí)得約定的論文時(shí),她說(shuō):“他們做的事情真酷?!钡旨由弦痪湔f(shuō),“有趣的問(wèn)題”是來(lái)自上下文的自發(fā)推理。

不過(guò),牛津大學(xué)的計(jì)算機(jī)科學(xué)家、DeepMind那兩篇論文的合著者Jakob Foerster說(shuō):“我并不認(rèn)為我們有可信的方法來(lái)開始考慮自發(fā)推理需要什么。說(shuō)實(shí)話,我們離去考慮那個(gè)問(wèn)題還相當(dāng)遠(yuǎn)?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103609
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35147

    瀏覽量

    279830
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49019

    瀏覽量

    249474
  • 機(jī)器
    +關(guān)注

    關(guān)注

    0

    文章

    790

    瀏覽量

    41284

原文標(biāo)題:人工智能玩家發(fā)明自己的“語(yǔ)言”,合作“交流”以贏得紙牌游戲

文章出處:【微信號(hào):IEEE_China,微信公眾號(hào):IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺(tái),加速企業(yè)人工智能應(yīng)用

    -Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺(tái),加速企業(yè)人工智能應(yīng)用 Cognizant將在關(guān)鍵增長(zhǎng)領(lǐng)域提供解決方案,包括企業(yè)級(jí)AI智能體、定制化行業(yè)大型
    的頭像 發(fā)表于 03-26 14:42 ?316次閱讀
    Cognizant將與NVIDIA<b class='flag-5'>合作</b>部署神經(jīng)<b class='flag-5'>人工智能</b>平臺(tái),加速企業(yè)<b class='flag-5'>人工智能</b>應(yīng)用

    Stellantis與Mistral AI深化人工智能合作

    近日,Stellantis宣布與Mistral AI進(jìn)一步擴(kuò)大人工智能戰(zhàn)略合作伙伴關(guān)系,旨在將人工智能技術(shù)深度整合到車輛工程、車內(nèi)體驗(yàn)等多個(gè)關(guān)鍵領(lǐng)域,共同推動(dòng)汽車行業(yè)的智能化發(fā)展。
    的頭像 發(fā)表于 02-11 15:50 ?402次閱讀

    我國(guó)生成式人工智能的發(fā)展現(xiàn)狀與趨勢(shì)

    作為信息化、數(shù)字化、智能化的新型技術(shù)基座,生成式人工智能對(duì)于提升國(guó)家戰(zhàn)略地位與國(guó)際競(jìng)爭(zhēng)力具有重要意義。2022年11月以來(lái),隨著ChatGPT為代表的大語(yǔ)言模型迅速發(fā)展,生成式
    的頭像 發(fā)表于 02-08 11:31 ?1486次閱讀

    編程語(yǔ)言人工智能中的使用

    。編程語(yǔ)言在AI的發(fā)展中扮演著至關(guān)重要的角色,它們?yōu)殚_發(fā)人員提供了構(gòu)建和實(shí)現(xiàn)智能系統(tǒng)的工具和框架。 1. Python Python是人工智能領(lǐng)域最受歡迎的編程語(yǔ)言之一,原因有以下幾點(diǎn)
    的頭像 發(fā)表于 11-15 09:34 ?984次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    嵌入式和人工智能究竟是什么關(guān)系? 嵌入式系統(tǒng)是一種特殊的系統(tǒng),它通常被嵌入到其他設(shè)備或機(jī)器中,實(shí)現(xiàn)特定功能。嵌入式系統(tǒng)具有非常強(qiáng)的適應(yīng)性和靈活性,能夠根據(jù)用戶需求進(jìn)行定制化設(shè)計(jì)。它廣泛應(yīng)用于各種
    發(fā)表于 11-14 16:39

    LLM技術(shù)對(duì)人工智能發(fā)展的影響

    隨著人工智能技術(shù)的飛速發(fā)展,大型語(yǔ)言模型(LLM)技術(shù)已經(jīng)成為推動(dòng)AI領(lǐng)域進(jìn)步的關(guān)鍵力量。LLM技術(shù)通過(guò)深度學(xué)習(xí)和自然語(yǔ)言處理技術(shù),使得機(jī)器能夠理解和生成自然語(yǔ)言,極大地?cái)U(kuò)展了
    的頭像 發(fā)表于 11-08 09:28 ?1853次閱讀

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    和國(guó)際合作等多個(gè)層面。這些內(nèi)容讓我更加認(rèn)識(shí)到,在推動(dòng)人工智能與能源科學(xué)融合的過(guò)程中,需要不斷探索和創(chuàng)新,應(yīng)對(duì)各種挑戰(zhàn)和機(jī)遇。 最后,通過(guò)閱讀這一章,我深刻感受到人工智能對(duì)于能源科學(xué)的
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我一個(gè)閱讀此書的機(jī)會(huì),感謝平臺(tái)。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和深遠(yuǎn)影響。在
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    周末收到一本新書,非常高興,也非常感謝平臺(tái)提供閱讀機(jī)會(huì)。 這是一本挺好的書,包裝精美,內(nèi)容詳實(shí),干活滿滿。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》這本書的第一章,作為整個(gè)著作的開篇
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    長(zhǎng)時(shí)間運(yùn)行或電池供電的設(shè)備尤為重要。 高性能 : 盡管RISC-V架構(gòu)低功耗著稱,但其高性能也不容忽視。通過(guò)優(yōu)化指令集和處理器設(shè)計(jì),RISC-V可以在處理復(fù)雜的人工智能圖像處理任務(wù)時(shí)表現(xiàn)出色。 三
    發(fā)表于 09-28 11:00

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問(wèn)下哪些比較容易學(xué) 不過(guò)好像都是要學(xué)的
    發(fā)表于 09-26 15:24

    人工智能ai4s試讀申請(qǐng)

    目前人工智能在繪畫對(duì)話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個(gè)需要研究的課題,本書對(duì)ai4s基本原理和原則,方法進(jìn)行描訴,有利于總結(jié)經(jīng)驗(yàn),擬按照要求準(zhǔn)備相關(guān)體會(huì)材料??茨芊裼兄谌腴T和提高ss
    發(fā)表于 09-09 15:36

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    活的世界? 編輯推薦 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》聚焦于人工智能與材料科學(xué)、生命科學(xué)、電子科學(xué)、能源科學(xué)、環(huán)境科學(xué)五大領(lǐng)域的交叉融合,通過(guò)深入淺出的語(yǔ)言和諸多實(shí)際應(yīng)用案例,介紹了
    發(fā)表于 09-09 13:54

    報(bào)名開啟!深圳(國(guó)際)通用人工智能大會(huì)將啟幕,國(guó)內(nèi)外大咖齊聚話AI

    呈現(xiàn)、產(chǎn)業(yè)展覽、技術(shù)交流、學(xué)術(shù)論壇于一體的世界級(jí)人工智能合作交流平臺(tái)。本次大會(huì)暨博覽會(huì)由工業(yè)和信息化部政府采購(gòu)中心、廣東省工商聯(lián)、前海合作區(qū)
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場(chǎng)可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過(guò)程加速:FPGA可以用來(lái)加速深度學(xué)習(xí)的訓(xùn)練和推理過(guò)程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05