一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度強化學(xué)習(xí)平臺為玩家?guī)硇碌娜斯ぶ悄荏w驗

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Michelle Horton ? 2022-04-07 16:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

得益于索尼 AI 、索尼互動娛樂( SIE )以及 GT Sport 的開發(fā)者 Polyphony Digital Inc 。的最新合作, Gran Turismo ( GT ) Sport 的競爭對手正面臨一個新的、 AI 超級強大的競爭者。

被稱為 Gran Turismo Sophy ( GT Sophy )的自主人工智能賽車代理最近擊敗了 GT 運動領(lǐng)域的世界最佳車手。發(fā)表在 Nature, 上的 工作 介紹了一種新的深度強化學(xué)習(xí)平臺,用于創(chuàng)建 GT Sophy ,并可能為全球玩家?guī)硇碌娜斯ぶ悄荏w驗。

索尼集團公司董事長、總裁兼首席執(zhí)行官吉田健一郎在一份 發(fā)布。 的聲明中說:“索尼的目的是‘通過創(chuàng)造力和技術(shù)的力量,讓世界充滿情感’,而大圖里斯莫·索菲就是這一點的完美體現(xiàn)?!?/p>

“我們?yōu)橛螒蛲婕掖蛟炝艘豢钣螒?AI ,這是索尼作為一家創(chuàng)意娛樂公司的獨特之處。它標(biāo)志著 AI 發(fā)展的重大飛躍,同時也為全球 GT 粉絲提供了增強的體驗?!?/p>

Smart gaming

人工智能對游戲來說并不新鮮。 2017 年,來自 DeepMind 的 Alpha Zero 項目在學(xué)會玩和征服國際象棋、日本象棋和使用深度強化學(xué)習(xí)( deep RL )圍棋時成為新聞

作為機器學(xué)習(xí)的一種補償, deep RL 在基本術(shù)語中使用計算 RL 代理通過試錯來做出決策,以解決問題。在算法中引入深度學(xué)習(xí)后,智能體從非常大的數(shù)據(jù)集做出決策,并決定有效地實現(xiàn)其目標(biāo)的行動。

Alpha Zero 程序使用了一種算法,一個未經(jīng)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)對自己進行了數(shù)百萬次游戲,并根據(jù)其結(jié)果調(diào)整游戲。

然而,賽車人工智能對來自不同汽車、賽道、駕駛員、天氣和對手的無數(shù)變量提出了更復(fù)雜的推理需求。作為最逼真的駕駛模擬器之一, GT Sport 使用真實的賽車和賽道尺寸,通過考慮空氣阻力和輪胎摩擦等因素再現(xiàn)比賽環(huán)境。

強化良好行為

該團隊創(chuàng)建了一個能夠適應(yīng)實時因素的賽車代理,并使用新開發(fā)的 deep RL 算法對 GT Sophy 進行了賽車控制、賽車戰(zhàn)術(shù)和賽車禮儀三項具體技能的培訓(xùn)。根據(jù) project’s website ,該算法使用最新的強化學(xué)習(xí)技術(shù),根據(jù)賽車經(jīng)紀(jì)人的行為對其進行獎勵或懲罰。

研究人員在研究報告中寫道:“使用 deep RL 開發(fā)賽車代理的優(yōu)點之一是,工程師無需編程如何以及何時執(zhí)行贏得比賽所需的技能,只要它暴露在正確的條件下,代理通過反復(fù)試驗學(xué)會做正確的事?!薄?/p>

該團隊定制了一個基于網(wǎng)絡(luò)的分布式異步部署和培訓(xùn)( DART )平臺,使用 SIE 的全球云基礎(chǔ)設(shè)施研究人員在 PlayStation 4 控制臺上培訓(xùn) GT Sophy ,然后使用 DART 收集培訓(xùn)數(shù)據(jù)并評估代理的版本。

使用這個系統(tǒng),研究人員指定一個實驗,自動運行,并在網(wǎng)絡(luò)瀏覽器中查看數(shù)據(jù)。每個實驗都在一個計算節(jié)點上使用一個培訓(xùn)師,該培訓(xùn)師使用 cuDNN 加速的 TensorFlow 深度學(xué)習(xí)框架和 NVIDIA V100 GPU 或 NVIDIA A100 GPU 的一半,再加上大約 8 個 CPU 和 55 個 記憶的碎片。

據(jù) project’s website 報道,“該系統(tǒng)允許索尼人工智能的研究團隊無縫地同時運行數(shù)百個實驗,同時探索將 GT Sophy 提升到下一個水平的技術(shù)。”。

增壓燃氣輪機

在 2021 ,世界上最好的 GT 賽車手中有四人在兩個單獨的比賽中與 GT Suffy 競爭。這些比賽包括三個賽馬場、四名 GT Sophy 經(jīng)紀(jì)人和賽車。在首次亮相時, GT Sophy 在計時賽中表現(xiàn)出色,但在同一賽道上挑戰(zhàn)賽車手時表現(xiàn)不佳。

該隊在第一場比賽結(jié)果的基礎(chǔ)上進行了改進,升級了訓(xùn)練體系,增加了網(wǎng)絡(luò)規(guī)模,調(diào)整了特征和獎勵,增強了對手。

這一結(jié)果造就了一名賽車經(jīng)紀(jì)人,他可以在急轉(zhuǎn)彎處超越一名人類駕駛員,處理擁擠的起跑,在滑流中進行彈弓傳球,并執(zhí)行防守動作。經(jīng)紀(jì)人這樣做的同時,也遵守了人類駕駛員理解和實踐的微妙的體育道德考慮。在計時賽和 FIA 認證的格蘭賽車錦標(biāo)賽系列賽中,它也擊敗了頂尖的人力車手。

據(jù)報道, GT Sophy 在短短幾個小時內(nèi)就學(xué)會了繞道而行。在大約兩天的時間里,它可以擊敗大約 95% 的人類玩家。給它 10 到 12 天,大約 45 , 00 個駕駛小時, GT Sophy 就等于或超過了世界頂級車手。

憑借其賽車實力, GT Sophy 的目標(biāo)是讓 GT 運動更有趣、更具競爭力和教育性。一些與 GT Sophy 競爭的專家報告說,他們學(xué)習(xí)了轉(zhuǎn)彎和駕駛技術(shù)的新方法。

研究人員還發(fā)現(xiàn), deep RL 有可能改善協(xié)作機器人、無人機自動駕駛車輛等系統(tǒng)的實際應(yīng)用。

關(guān)于作者

Michelle Horton 是 NVIDIA 的高級開發(fā)人員通信經(jīng)理,擁有通信經(jīng)理和科學(xué)作家的背景。她在 NVIDIA 為開發(fā)者博客撰文,重點介紹了開發(fā)者使用 NVIDIA 技術(shù)的多種方式。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    29748

    瀏覽量

    212911
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106420
  • 自動駕駛
    +關(guān)注

    關(guān)注

    790

    文章

    14321

    瀏覽量

    170682
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    人工智能和機器學(xué)習(xí)以及Edge AI的概念與應(yīng)用

    作者:DigiKey Editor 人工智能(AI)已經(jīng)是當(dāng)前科技業(yè)最熱門的話題,且其應(yīng)用面涉及人類生活的各個領(lǐng)域,對于各個產(chǎn)業(yè)都帶來相當(dāng)重要的影響,且即將改變?nèi)祟愇磥戆l(fā)展的方方面面。本文將為您介紹
    的頭像 發(fā)表于 01-25 17:37 ?936次閱讀
    <b class='flag-5'>人工智能</b>和機器<b class='flag-5'>學(xué)習(xí)</b>以及Edge AI的概念與應(yīng)用

    嵌入式和人工智能究竟是什么關(guān)系?

    、連接主義和深度學(xué)習(xí)等不同的階段。目前,人工智能已經(jīng)廣泛應(yīng)用于各種領(lǐng)域,如自然語言處理、計算機視覺、智能推薦等。 嵌入式系統(tǒng)和人工智能在許
    發(fā)表于 11-14 16:39

    AI人工智能技術(shù)主要應(yīng)用于什么方面,給未來帶來什么影響?

    解決復(fù)雜的決策問題到優(yōu)化日常生活中的各類服務(wù),AI的應(yīng)用領(lǐng)域廣泛而深入,以下將詳述其主要應(yīng)用場景及所帶來的深遠影響。 在工業(yè)生產(chǎn)中,人工智能通過機器人技術(shù)、自主控制和預(yù)測性維護等手段重塑了制造業(yè)格局?;跈C器學(xué)習(xí)
    的頭像 發(fā)表于 11-05 18:11 ?1696次閱讀

    如何使用 PyTorch 進行強化學(xué)習(xí)

    的計算圖和自動微分功能,非常適合實現(xiàn)復(fù)雜的強化學(xué)習(xí)算法。 1. 環(huán)境(Environment) 在強化學(xué)習(xí)中,環(huán)境是一個抽象的概念,它定義了智能體(agent)可以執(zhí)行的動作(actions)、觀察到
    的頭像 發(fā)表于 11-05 17:34 ?1043次閱讀

    豐田與NTT攜手打造人工智能平臺

    豐田汽車公司近日宣布了一項令人矚目的合作計劃。據(jù)悉,該公司將與日本電信巨頭NTT公司攜手,共同開發(fā)一個全新的人工智能平臺。這一項目的啟動時間定于2025年,預(yù)示著豐田與NTT將在未來的人工智能領(lǐng)域
    的頭像 發(fā)表于 11-04 10:48 ?654次閱讀

    人工智能、機器學(xué)習(xí)深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中一個很大的子集是機器學(xué)習(xí)——讓算法從數(shù)據(jù)中學(xué)習(xí)
    發(fā)表于 10-24 17:22 ?2980次閱讀
    <b class='flag-5'>人工智能</b>、機器<b class='flag-5'>學(xué)習(xí)</b>和<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    幸得一好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)用。這一章詳細
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運社區(qū)給我一個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    人工智能在科學(xué)研究中的核心技術(shù),包括機器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析復(fù)雜的數(shù)據(jù)集,從而發(fā)現(xiàn)隱藏在數(shù)據(jù)中的模式和規(guī)
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    ,無疑為讀者鋪設(shè)了一條探索人工智能(AI)如何深刻影響并推動科學(xué)創(chuàng)新的道路。在閱讀這一章后,我深刻感受到了人工智能技術(shù)在科學(xué)領(lǐng)域的廣泛應(yīng)用潛力以及其帶來的革命性變化,以下是我個人的學(xué)習(xí)
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    RISC-V和Arm內(nèi)核及其定制的機器學(xué)習(xí)和浮點運算單元,用于處理復(fù)雜的人工智能圖像處理任務(wù)。 四、未來發(fā)展趨勢 隨著人工智能技術(shù)的不斷發(fā)展和普及,RISC-V在人工智能圖像處理領(lǐng)域的
    發(fā)表于 09-28 11:00

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新

    AI for Science的基礎(chǔ)知識,梳理了產(chǎn)業(yè)地圖,并給出了相關(guān)政策啟示。 內(nèi)容提要 人工智能驅(qū)動科學(xué)創(chuàng)新(AI for Science)帶來的產(chǎn)業(yè)變革與每個人息息相關(guān)。本書聚焦于人工智能
    發(fā)表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    呈現(xiàn)、產(chǎn)業(yè)展覽、技術(shù)交流、學(xué)術(shù)論壇于一體的世界級人工智能合作交流平臺。本次大會暨博覽會由工業(yè)和信息化部政府采購中心、廣東省工商聯(lián)、前海合作區(qū)管理局、深圳市工信局等單位指導(dǎo),深圳市人工智能產(chǎn)業(yè)協(xié)會主辦
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)
    發(fā)表于 07-29 17:05