一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你們不是嫌棄世界冠軍OG團(tuán)隊(duì)實(shí)力太水嗎?“你行你上”的機(jī)會(huì)來(lái)了

電子工程師 ? 來(lái)源:lp ? 2019-04-22 13:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

你們不是嫌棄世界冠軍 OG 團(tuán)隊(duì)實(shí)力太水嗎?“你行你上”的機(jī)會(huì)來(lái)了。

4 月 14 日凌晨,OpenAI Five 以 2:0 擊敗了 DOTA 世界冠軍團(tuán)隊(duì) OG 引發(fā)熱議。比賽當(dāng)天,OpenAI 也宣布要開(kāi)放 OpenAI Five 競(jìng)技場(chǎng)模式,讓每個(gè)感興趣的人都參與其中。

4 月 18 日(太平洋標(biāo)準(zhǔn)時(shí)間)下午 6 點(diǎn),OpenAI 如約開(kāi)放了這一模式,全世界各路玩家都可以免費(fèi)進(jìn)行體驗(yàn)。開(kāi)放時(shí)間為期三天,4 月 21 日(太平洋標(biāo)準(zhǔn)時(shí)間)晚上 11 點(diǎn) 59 分關(guān)閉,要體驗(yàn)一把人機(jī)對(duì)戰(zhàn)的話(huà)可得抓緊時(shí)間。

參賽鏈接:https://arena.openai.com/#/

目前從其官網(wǎng)賽況來(lái)看,截止今天早上 10 點(diǎn),OpenAI Five 與參與者打了 424 場(chǎng)比賽,AI 以 112-0 完勝人類(lèi)玩家。

以下是人類(lèi)參與者的部分賽況:

據(jù) OpenAI 官方介紹,參與者可以在競(jìng)爭(zhēng)模式和合作模式下體驗(yàn) OpenAI Five。他們的 1v1 機(jī)器人可以通過(guò)巧妙的策略加以利用,但他們也并不知道 OpenAI Five 能在多大程度上可以做到這一點(diǎn)。

在此前決賽中,他們展示了 OpenAI Five 和人類(lèi)在合作模式打游戲。一組是 Sheever、Blitz 和三個(gè) OpenAI Five,對(duì)手是由 Capitalist、ODPixel 和三個(gè) OpenAI Five 組成的團(tuán)隊(duì)。

不過(guò),通過(guò) OpenAI Five 在決賽上的表現(xiàn),OpenAI 團(tuán)隊(duì)在最新的博客中分享了兩個(gè)驚喜:

盡管訓(xùn)練 OpenAI Five 系統(tǒng)的目的是為了打敗其他機(jī)器人,但他們卻發(fā)現(xiàn) OpenAI Five 其實(shí)還有與人類(lèi)成為隊(duì)友的基本能力,也就是說(shuō)可以將一個(gè)競(jìng)爭(zhēng)型 AI 變?yōu)楹献餍?AI。他們認(rèn)為,如果能更努力去開(kāi)發(fā),未來(lái) AI 系統(tǒng)能為人類(lèi)做出非常多的貢獻(xiàn)。

4 月 18 日 到 21 日的競(jìng)技場(chǎng)模式測(cè)試將回答一個(gè)很重要的研究問(wèn)題——OpenAI Five 的潛能可以被人類(lèi)運(yùn)用到何種程度,或者它們?cè)谄渌男┓矫姹囟〞?huì)被打敗。OpenAI Five 這一深度強(qiáng)化學(xué)習(xí)智能體系統(tǒng),可能會(huì)成為有史以來(lái)人類(lèi)能與之交互的最大的 AI 部署系統(tǒng)。

OG戰(zhàn)隊(duì)與OpenAI開(kāi)發(fā)團(tuán)隊(duì)

對(duì)于 OpenAI Five 競(jìng)技場(chǎng)模式,有很多人報(bào)以期待,reddit 上有網(wǎng)友評(píng)論稱(chēng),“這特么太酷了,自從 OpenAI 1v1 首秀之后,人們已經(jīng)要求要在網(wǎng)上跟機(jī)器人玩游戲了,現(xiàn)在它真的發(fā)生了!”

只是,如果在競(jìng)爭(zhēng)模式跟 AI 打 DOTA,作為人類(lèi)玩家的你會(huì)不會(huì)慘遭OpenAI Five 的虐殺,而輸?shù)煤翢o(wú)懸念呢?祝你們好運(yùn)。

當(dāng)然,玩游戲之余,你可能也想知道:OpenAI Five 取得勝利背后的“秘訣”是什么?為什么這次的 OpenAI Five 系統(tǒng)要比去年在 TI 表演賽上敗給人類(lèi)的AI系統(tǒng)更強(qiáng)?OpenAI 是如何訓(xùn)練 OpenAI Five 系統(tǒng)的?OpenAI 團(tuán)隊(duì)最近給出了解讀。

為什么是 DOTA2?

一開(kāi)始,OpenAI 團(tuán)隊(duì)研究 OpenAI Five 是為了解決超出現(xiàn)有深度強(qiáng)化學(xué)習(xí)算法能力范圍的問(wèn)題,他們希望通過(guò)現(xiàn)有的方法解決當(dāng)下無(wú)法解決的問(wèn)題,原以為這需要復(fù)雜的算法思想(比如分層強(qiáng)化學(xué)習(xí)(Hierarchical RL)),但他們驚訝地發(fā)現(xiàn)只需要改進(jìn)的是規(guī)模,但實(shí)現(xiàn)和利用這個(gè)規(guī)模并不容易,這成了其研究的主要內(nèi)容。

OpenAI Five 把世界看作是一串必須破譯的數(shù)字。無(wú)論這些數(shù)字是以 DOTA 游戲形式(約 20000 個(gè)數(shù)字),還是以機(jī)械手形式(約 200 個(gè)),使用的都是通用學(xué)習(xí)代碼。

為了創(chuàng)建 OpenAI Five,OpenAI 團(tuán)隊(duì)創(chuàng)造了一個(gè)名為 Rapid 的系統(tǒng),用來(lái)以從未有過(guò)的規(guī)模去運(yùn)行 PPO(Proximal Policy Optimization),結(jié)果出人意料,居然創(chuàng)造了一個(gè)不受任何基本性能限制的世界級(jí) DOTA 機(jī)器人。

如今,RL 算法表現(xiàn)出了驚人的能力,但它在游戲或模擬環(huán)境之外卻用處不大,但這個(gè)限制可能并沒(méi)有聽(tīng)起來(lái)的那么糟糕,例如可以使用 Rapid 來(lái)控制機(jī)械手來(lái)重新移動(dòng)一個(gè)模塊,這需要首先進(jìn)行模擬訓(xùn)練,然后在物理機(jī)器人上執(zhí)行。他們認(rèn)為,對(duì)于 RL 的下一個(gè)挑戰(zhàn)是減少對(duì)經(jīng)驗(yàn)的依賴(lài)。

雖然他們決定不再讓 OpenAI Five 成為競(jìng)爭(zhēng)對(duì)手,但社會(huì)進(jìn)步和技術(shù)發(fā)展將繼續(xù)推動(dòng)未來(lái)的研究,這也并非 DOTA 比賽研究的終點(diǎn),他們認(rèn)為 DOTA 比賽對(duì) RL 開(kāi)發(fā)來(lái)說(shuō)是一個(gè)比現(xiàn)在使用的標(biāo)準(zhǔn)環(huán)境更有趣、更復(fù)雜、也更好理解的環(huán)境。

算力

與 DOTA2 在去年的 TI 表演賽的失利相比,OpenAI Five 在 4 月 14 日戰(zhàn)勝 OG 團(tuán)隊(duì)的主要原因是其訓(xùn)練的計(jì)算量增加了 8 倍。去年比賽后,OpenAI 團(tuán)隊(duì)將項(xiàng)目中的絕大部分計(jì)算用于訓(xùn)練 OpenAI Five 模型,同時(shí)還增加了訓(xùn)練時(shí)間。

OpenAI Five 的 TrueSkill,由于已經(jīng)使用了額外的訓(xùn)練計(jì)算,所以用線來(lái)劃分主要的系統(tǒng)變化。這張圖的走向大致是線性的,意味著 OpenAI Five 不斷從額外計(jì)算中獲益。

總之 ,OpenAI Five 的當(dāng)前版本已經(jīng)訓(xùn)練了 800 petaflop/s /天,并且在10個(gè)實(shí)時(shí)月的時(shí)間內(nèi)進(jìn)行相當(dāng)于人類(lèi)大約 45000 年時(shí)長(zhǎng)的 DOTA 游戲自我訓(xùn)練,相當(dāng)于人類(lèi)每天平均有 250 年的模擬訓(xùn)練。OpenAI Five 的最終版本與 TI 版本相比,勝率是 99.9%。

18 個(gè)英雄

從訓(xùn)練 5 名英雄到 18 名英雄時(shí)的訓(xùn)練進(jìn)度幾乎沒(méi)有放緩,他們已經(jīng)假設(shè)同樣的情況如果發(fā)生在更多的英雄身上會(huì)怎樣。TI比賽后,又花了很多精力去整合新的英雄。

他們花了幾周時(shí)間去訓(xùn)練多達(dá) 25 個(gè)英雄的英雄池,將這些英雄帶到大約 5k MMR(大約是95% DOTA 玩家的水平)。雖然在進(jìn)步,但學(xué)習(xí)速度不夠快,無(wú)法在決賽前達(dá)到職業(yè)水平。研究人員還沒(méi)有時(shí)間去找到原因,但后來(lái)發(fā)現(xiàn)模型容量不足,需要更好的匹配來(lái)擴(kuò)展英雄池,還需要更多的訓(xùn)練時(shí)間來(lái)讓新英雄趕上老英雄。但想象一下,當(dāng)一個(gè)人掌握了自己的英雄時(shí),再去學(xué)習(xí)一個(gè)新英雄是多么困難。

對(duì)了,這里明明說(shuō)訓(xùn)練了 18 個(gè)英雄,但為什么在與 OG 比賽時(shí)只放了 17 個(gè)英雄?因?yàn)檫€有一個(gè)英雄在 DOTA v7.20 版本中出現(xiàn)了明顯變化,所以就沒(méi)用。

最后,這么好的機(jī)會(huì),要不要去體驗(yàn)下被機(jī)器人在 DOTA 中碾壓的酸爽感?

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29726

    瀏覽量

    212811
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    302

    瀏覽量

    11078
  • 強(qiáng)化學(xué)習(xí)

    關(guān)注

    4

    文章

    269

    瀏覽量

    11597

原文標(biāo)題:“你行你上”:有本事跟OpenAI Five打一把DOTA?| 極客頭條

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    科普|關(guān)于GPS和GNSS,了解多少?

    定位(Positioning)為萬(wàn)物互聯(lián)提供了最基礎(chǔ)信息;當(dāng)今以GPS、GLONASS、Galileo和Beidou為代表的全球定位系統(tǒng)為人們帶來(lái)了極大便利;而對(duì)于它們不是真正的了解,回答完以下
    的頭像 發(fā)表于 06-28 07:06 ?317次閱讀
    科普|關(guān)于GPS和GNSS,<b class='flag-5'>你</b>了解多少?

    所以做出來(lái)了

    所以做出來(lái)了嗎,求
    發(fā)表于 06-16 01:43

    放大的信號(hào),點(diǎn)亮世界——運(yùn)算放大器大揭秘

    嘿,電子迷們!今天,我們要聊一個(gè)超級(jí)厲害的小玩意兒——運(yùn)算放大器(Op-Amp)!聽(tīng)起來(lái)是不是有點(diǎn)高大?別擔(dān)心,我保證讓輕松搞懂它,還能讓覺(jué)得它超酷!1什么是運(yùn)算放大器想象一下,
    的頭像 發(fā)表于 06-13 20:06 ?189次閱讀
    放大<b class='flag-5'>你</b>的信號(hào),點(diǎn)亮<b class='flag-5'>你</b>的<b class='flag-5'>世界</b>——運(yùn)算放大器大揭秘

    亞洲首位斯諾克世界錦標(biāo)賽冠軍趙心童成為比亞迪冠軍形象大使

    5月23日,比亞迪宣布亞洲首位斯諾克世界錦標(biāo)賽冠軍趙心童正式成為比亞迪冠軍形象大使。 斯諾克運(yùn)動(dòng)起源于英國(guó),憑借巧妙的球路規(guī)劃、精準(zhǔn)的擊球技巧以及選手間復(fù)雜的心理博弈,在全球擁有眾多愛(ài)好者。在剛剛
    的頭像 發(fā)表于 05-27 14:42 ?144次閱讀

    失去工作不是因?yàn)锳I,而是因?yàn)槭褂肁I的人

    當(dāng)算法能精準(zhǔn)預(yù)測(cè)消費(fèi)者需求時(shí),當(dāng)AI生成的文案比人類(lèi)更懂傳播心理學(xué)時(shí),當(dāng)自動(dòng)化系統(tǒng)開(kāi)始取代基礎(chǔ)決策崗位時(shí),真正的危機(jī)已悄然降臨—— 不是AI在搶奪的工作,而是那些比你更早掌握AI、更懂得如何駕馭
    的頭像 發(fā)表于 05-13 12:05 ?229次閱讀
    <b class='flag-5'>你</b>失去工作<b class='flag-5'>不是</b>因?yàn)锳I,而是因?yàn)槭褂肁I的人

    CFA科普系列01|EDA工具裝不?可能不是技術(shù)差,而是少了這兩個(gè)命令

    CFA科普系列01|EDA工具裝不?可能不是技術(shù)差,而是少了這兩個(gè)命令 在芯片設(shè)計(jì)工作中,EDA工具的安裝往往是新手或運(yùn)維人員最容易卡住的一步。不少人曾因一個(gè) RPM 包的依賴(lài)安裝失敗,陷入漫長(zhǎng)
    發(fā)表于 05-09 15:27

    比亞迪海鷗榮膺2025世界汽車(chē)大獎(jiǎng)“世界城市車(chē)”冠軍

    近日,全球汽車(chē)行業(yè)權(quán)威獎(jiǎng)項(xiàng)“2025世界汽車(chē)大獎(jiǎng)”(World Car Awards)于紐約國(guó)際車(chē)展正式揭曉。比亞迪海鷗憑借其創(chuàng)新的設(shè)計(jì)理念、卓越的城市通勤性能及全球市場(chǎng)的高度認(rèn)可,從全球12款候選車(chē)型中脫穎而出,榮膺“2025世界城市車(chē)(World Urban Car)
    的頭像 發(fā)表于 04-18 17:52 ?544次閱讀

    嵌入式來(lái)了,還在等什么?(可下載)

    笑話(huà)。每個(gè)人都在要求進(jìn)步,每個(gè)人都被逼著進(jìn)步,話(huà)說(shuō)沒(méi)什么不好。但對(duì)使用的各種智能產(chǎn)品又知道多少呢?我們來(lái)聊聊身邊的必備品:有多少都是嵌入式或者單片機(jī)做出來(lái)的
    發(fā)表于 03-20 15:06 ?0次下載

    PCB電路板連接器插不進(jìn)去,客戶(hù)說(shuō)用力

    PCB電路板的連接器插不去,找客戶(hù)確認(rèn),客戶(hù)說(shuō)不夠用力……
    的頭像 發(fā)表于 03-03 14:40 ?385次閱讀
    PCB電路板<b class='flag-5'>上</b>連接器插不進(jìn)去,客戶(hù)說(shuō)<b class='flag-5'>你</b>用力

    2024世界智能制造大會(huì)火熱進(jìn)行中!尋跡智4D04,誠(chéng)邀蒞臨~

    2024世界智能制造博覽會(huì)在南京國(guó)際博覽中心盛大開(kāi)幕,尋跡智展示了緊湊型托盤(pán)堆垛車(chē)BR-F12SL,協(xié)作式機(jī)械臂AMR-BR-D001A在智能搬運(yùn)領(lǐng)域的強(qiáng)大實(shí)力和創(chuàng)新能力,誠(chéng)邀各位參觀交流。
    的頭像 發(fā)表于 12-22 20:01 ?447次閱讀
    2024<b class='flag-5'>世界</b>智能制造大會(huì)火熱進(jìn)行中!尋跡智<b class='flag-5'>行</b>4D04,誠(chéng)邀蒞臨~

    冠軍說(shuō)|第二屆OpenHarmony競(jìng)賽訓(xùn)練營(yíng)冠軍團(tuán)隊(duì)專(zhuān)訪

    實(shí)現(xiàn)技術(shù)創(chuàng)新,解決現(xiàn)實(shí)問(wèn)題的呢? 高校創(chuàng)新技術(shù)人才又將如何助力OpenHarmony技術(shù)生態(tài)的繁榮與活力? 點(diǎn)擊下方視頻一起聽(tīng)冠軍說(shuō) 探秘冠軍團(tuán)隊(duì)與老師的獨(dú)家幕后分享 OpenHarmony 競(jìng)賽
    發(fā)表于 10-28 17:11

    明明我說(shuō)的是25G信號(hào),卻讓我看12.5G的損耗?

    還是從理論來(lái)說(shuō),我們這里提到的25G和12.5G其實(shí)不是一個(gè)概念。25G是說(shuō)這對(duì)差分信號(hào)的傳輸速率,單位是bps,也就是我們常說(shuō)的比特率。而協(xié)議12.5G指的是頻率,單位是Hz。那么重點(diǎn)來(lái)了,25G
    發(fā)表于 10-23 09:11

    可穿戴芯片細(xì)分市場(chǎng)機(jī)會(huì)來(lái)了,大算力產(chǎn)品、出海布局加速

    市場(chǎng)。終端市場(chǎng)的增長(zhǎng)給上游藍(lán)牙芯片廠商帶來(lái)了成長(zhǎng)機(jī)會(huì)。電子發(fā)燒友網(wǎng)整理了恒玄科技、杰理科技、中科藍(lán)訊、泰凌微、炬芯科技這五家企業(yè)的業(yè)績(jī)情況,由此分析上述企業(yè)在今年上半年的技術(shù)布局以及市場(chǎng)開(kāi)拓情況。 ? ? AI+ 可穿戴
    的頭像 發(fā)表于 09-19 09:27 ?4137次閱讀
    可穿戴芯片細(xì)分市場(chǎng)<b class='flag-5'>機(jī)會(huì)來(lái)了</b>,大算力產(chǎn)品、出海布局加速

    必知!如何有效保護(hù)的IP地址

    地址是一種通過(guò)加密和隧道技術(shù)在公共網(wǎng)絡(luò)建立專(zhuān)用網(wǎng)絡(luò)的方法。當(dāng)你連接到服務(wù)器時(shí),的真實(shí)IP地址會(huì)被隱藏,取而代之的是服務(wù)器分配給你的IP地址。 二、避免隨意點(diǎn)擊不明鏈接 網(wǎng)絡(luò)存在大量的惡意鏈接,這些鏈接可能會(huì)引導(dǎo)
    的頭像 發(fā)表于 09-07 11:16 ?887次閱讀

    認(rèn)識(shí)貼片電阻嗎,對(duì)他了解多少?

    認(rèn)識(shí)貼片電阻嗎,對(duì)他了解多少?
    的頭像 發(fā)表于 08-27 15:49 ?1215次閱讀
    <b class='flag-5'>你</b>認(rèn)識(shí)貼片電阻嗎,<b class='flag-5'>你</b>對(duì)他了解多少?