OpenAIFive在Dota2中以2:0擊敗了世界冠軍團(tuán)隊(duì),人機(jī)大戰(zhàn)人類最終不敵AI。OpenAIFive在去年輸?shù)舯荣惡筮M(jìn)行了優(yōu)化,訓(xùn)練時(shí)間相當(dāng)于人類玩了4.5萬年。
OpenAI可以宣布自己是世界第一了。
今天凌晨,OpenAIFive在Dota2中以2:0擊敗了世界冠軍團(tuán)隊(duì)OG,再次顯示出了AI的強(qiáng)大威力,也正式宣告人類在Dota這種高難度游戲中成為AI的手下敗將。
這次比賽,OpenAIFive的表現(xiàn)出是迄今為止展示出的最高水平:人類對(duì)手去年贏得了世界上最令人垂涎的電子競技賽事TI8的冠軍;OpenAIFive在去年輸?shù)舯荣惡筮M(jìn)行了優(yōu)化,訓(xùn)練時(shí)間相當(dāng)于人類玩了4.5萬年,贏得比賽也并不出乎意料。
人類對(duì)手OG團(tuán)隊(duì)
2:0,AI戰(zhàn)勝人類
在這場人機(jī)大戰(zhàn)中,每隊(duì)只有17個(gè)英雄可供選擇。OpenAI還選擇了所謂的“Captain'sDraft”游戲模式。與之前的比賽一樣,OpenAI也禁用了召喚和幻覺功能,這兩項(xiàng)功能都涉及以英雄副本的形式引入其他變量,以及OpenAI訓(xùn)練系統(tǒng)時(shí)未考慮的一些特殊因素和單位。
除此之外,這場比賽與正常的Dota2比賽一樣,其最終目標(biāo)是摧毀敵方隊(duì)伍的“基地”,即每個(gè)團(tuán)隊(duì)領(lǐng)土末端的大型塔樓,在敵人的隊(duì)伍成功摧毀其他小型塔后,基地是很脆弱的,整個(gè)比賽過程的中心是對(duì)塔的攻防,以及英雄與英雄之間的團(tuán)戰(zhàn)。
在第一場比賽中,OpenAIFive讓對(duì)手OG大吃一驚,通過一系列激進(jìn)戰(zhàn)術(shù)獲得了勝利,其中包括對(duì)游戲中獲取的金幣的花費(fèi)方式,在本方英雄死亡時(shí)立即買活,即使在比賽初期也是如此。
對(duì)此,OpenAI首席技術(shù)官GregBrockman指出,OpenAI喜歡有利于短期收益的戰(zhàn)略,說明在長期規(guī)劃上不如人類,而且DOTA2這種游戲通常要依賴于長期規(guī)劃才能獲勝。然而,在這場比賽中,這種早期的買活策略得到了回報(bào),OpenAIFive獲得了優(yōu)勢(shì),當(dāng)比賽拖入30分鐘時(shí),OG頂不住了。
在第二場比賽中,OpenAI表現(xiàn)更好,在最初的幾分鐘內(nèi)即獲得了對(duì)OG的早期優(yōu)勢(shì),然后無情碾壓了人類玩家,在第一場比賽時(shí)間剛剛過半的時(shí)間點(diǎn)上即取得勝利。
值得注意的是,OpenAIFive在第二場比賽中開始玩得異常激進(jìn),以及OG在AI全圖范圍內(nèi)的推進(jìn)時(shí)有些無力對(duì)抗。OpenAIFive能夠利用其特定的英雄選擇帶來的優(yōu)勢(shì)。
飛速進(jìn)化的OpenAIFive:已經(jīng)訓(xùn)練4.5萬年
去年8月,OpenAIFive曾以3:2擊敗半職業(yè)人類玩家,不過當(dāng)面對(duì)職業(yè)對(duì)手時(shí),OpenAI便輸給了paiNGaming戰(zhàn)隊(duì),帥不過三秒。
根據(jù)OpenAI聯(lián)合創(chuàng)始人兼主席GregBrockman(也是該組織的CTO)的說法,在輸?shù)舯荣愔?,OpenAIFive是通過在加速的虛擬環(huán)境中進(jìn)行自我改進(jìn)而變得更加強(qiáng)大的。
OpenAIFive由深度強(qiáng)化學(xué)習(xí)提供支持,也就是說它的編碼目的不是“如何游戲”,而是“如何學(xué)習(xí)”。Brockman在比賽開始前表示。,AI在10個(gè)月中,已經(jīng)玩了45000年的Dota2游戲,而且,玩了這么長時(shí)間也沒有覺得無聊。
這場比賽采用三局兩勝制,所有bot都使用相同的深度強(qiáng)化學(xué)習(xí)技術(shù)進(jìn)行訓(xùn)練,并由同一OpenAI系統(tǒng)的不同層獨(dú)立控制。
OpenAI向公眾開放與AI對(duì)決,終極目標(biāo)是實(shí)現(xiàn)通用人工智能
對(duì)于OpenAI來說,值得慶祝的不僅僅是這次勝利,還因?yàn)槠渥C明了對(duì)強(qiáng)化學(xué)習(xí)的態(tài)度及其關(guān)于AI的普適哲學(xué)樹立的里程碑。
研究團(tuán)隊(duì)將不再公開展示其AI游戲bot,而是致力于開發(fā)軟件,讓人類與OpenAIFive軟件實(shí)時(shí)協(xié)作,與機(jī)器人一起玩游戲,并學(xué)習(xí)他們獨(dú)特的前所未有的戰(zhàn)略和行為。
OpenAIFive還發(fā)布了一個(gè)平臺(tái),供公眾與OpenAIFive對(duì)戰(zhàn),這種模式稱為“競技場”模式,將于4月18日起開放三天。OpenAI表示,協(xié)作軟件可能永遠(yuǎn)不會(huì)向公眾開放,不過大家可以在活動(dòng)中親自嘗試一下。
OpenAI的聯(lián)合創(chuàng)始人兼首席執(zhí)行官SamAltman還表示,此類工作證明了與AI智能體的合作可能會(huì)在未來帶來巨大的利益。
Altman說:“對(duì)于世界如何運(yùn)作,如何訓(xùn)練這些智能體,令其實(shí)現(xiàn)協(xié)作上,這次活動(dòng)是重要的一課。實(shí)現(xiàn)人類與AI的合作,是我們對(duì)未來世界更積極的愿景之一,人工智能與人類共同努力,使人類變得更好、更有趣、更有影響力。”
OpenAI可能會(huì)繼續(xù)涉足Dota2和其他視頻游戲,主要是因?yàn)檫@些游戲是人工智能的良好測(cè)試平臺(tái),也是衡量AI技術(shù)進(jìn)步的良好基準(zhǔn)測(cè)試工具。
現(xiàn)在可能還沒有一個(gè)游戲像OpenAIFive這樣,AI系統(tǒng)最終無法具備超出人類能力的水平。對(duì)于更廣泛的AI行業(yè)而言,精通視頻游戲可能很快就會(huì)變得過時(shí),我們需要簡單的方式來證明AI系統(tǒng)可以快速學(xué)習(xí),并能夠更快速高效地的解決現(xiàn)實(shí)世界的困難任務(wù),獲得更有意義的好處。
最終,OpenAI希望將其Dota2學(xué)習(xí)并擴(kuò)展到游戲之外的新領(lǐng)域,并最終擴(kuò)展到現(xiàn)實(shí)世界中。為此,OpenAI正致力于使用強(qiáng)化學(xué)習(xí)和其他技術(shù),為機(jī)器人手提供更靈巧、更精細(xì)、更人性化的動(dòng)作。
“OpenAI正在努力的方向建立通用人工智能(AGI),并與世界分享這些好處,同時(shí)確保其安全性?!盇ltman說的是建立一個(gè)能夠執(zhí)行任何人類任務(wù)的多功能AI系統(tǒng)?!拔覀兊哪繕?biāo)不是戰(zhàn)勝電子游戲,雖然這很有趣。我們的目標(biāo)是揭開實(shí)現(xiàn)AGI道路上的秘密。”
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
29730瀏覽量
212836 -
AI
+關(guān)注
關(guān)注
88文章
35109瀏覽量
279602 -
強(qiáng)化學(xué)習(xí)
+關(guān)注
關(guān)注
4文章
269瀏覽量
11598
原文標(biāo)題:人類全面潰??!AI訓(xùn)練4.5萬年,DOTA 2人機(jī)大戰(zhàn)大結(jié)局
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
鴻蒙原生應(yīng)用開發(fā)也可以使用DeepSeek了
OpenAI宣布GPT 4o升智計(jì)劃
OpenAI宣布將在慕尼黑設(shè)立德國子公司
OpenAI將在德國慕尼黑設(shè)立子公司
OpenAI宣布將在德國慕尼黑開設(shè)新辦公室
Figure AI宣布終止與OpenAI合作,專注內(nèi)部研發(fā)
微軟調(diào)整協(xié)議,OpenAI獲準(zhǔn)使用其他云服務(wù)
OpenAI宣布API恢復(fù)運(yùn)行,ChatGPT正在逐步回歸
OpenAI 發(fā)了一個(gè)支持 ESP32 的 Realtime API SDK

OpenAI世界最貴大模型:昂貴背后的技術(shù)突破

OpenAI未來3周舉行12場新品發(fā)布會(huì) 我們能期待些什么? #OpenAI #人工智能 #AI

評(píng)論