資料介紹
描述
強(qiáng)化學(xué)習(xí)是人工智能的一個(gè)分支,計(jì)算機(jī)通過(guò)與問(wèn)題直接交互來(lái)了解問(wèn)題。該項(xiàng)目使用強(qiáng)化學(xué)習(xí)來(lái)嘗試學(xué)習(xí)在舊 iPhone 上玩 Doodle Jump 游戲。相機(jī)每秒從 iphone 拍攝 30 張圖像。對(duì)這些圖像進(jìn)行分析,然后一個(gè)簡(jiǎn)單的機(jī)器人通過(guò)旋轉(zhuǎn) iPhone 并按下屏幕上的按鈕來(lái)操縱 iPhone。
硬件
該項(xiàng)目的“智能”部分是運(yùn)行機(jī)器人操作系統(tǒng) (ROS) 和 TensorFlow 的 Nvidia Jetson。機(jī)器人包括:
- 用于旋轉(zhuǎn) iPhone 的步進(jìn)電機(jī)。
- 用于按下 iPhone 屏幕上的按鈕的伺服電機(jī)和螺線(xiàn)管。
- Ximea 相機(jī)用于捕捉 iPhone 屏幕的圖片,并通過(guò) USB3 將它們提供給 Jetson。
- EIBot 板驅(qū)動(dòng)步進(jìn)器和伺服系統(tǒng)。
- 復(fù)古外觀的盒子中還有一個(gè)電源,可為 Jetson 提供 12 伏電壓,為 EIBot 板提供 19 伏電壓,為 USB 集線(xiàn)器提供 5 伏電壓。
- 用于運(yùn)行 Linux 和控制事物的鍵盤(pán)、鼠標(biāo)和顯示器。
軟件
ROS 是構(gòu)建此類(lèi)項(xiàng)目的絕佳方式。使用 ROS,我可以將系統(tǒng)構(gòu)建為一組使用標(biāo)準(zhǔn)消息傳遞系統(tǒng)進(jìn)行通信的獨(dú)立進(jìn)程。該項(xiàng)目包括 C++ 和 Python 進(jìn)程。消息編譯器以?xún)煞N語(yǔ)言構(gòu)建存根,因此可以輕松傳遞消息。ROS的主要模塊包括:
- 從相機(jī)接收?qǐng)D像的相機(jī)驅(qū)動(dòng)程序。
- 從屏幕上讀取分?jǐn)?shù)的簡(jiǎn)單神經(jīng)網(wǎng)絡(luò)。
- 一個(gè)更大的、基于 TensorFlow 的神經(jīng)網(wǎng)絡(luò),用于分析從相機(jī)接收到的圖片。這是通過(guò)與機(jī)器人交互訓(xùn)練的網(wǎng)絡(luò)。
- 一個(gè)存檔過(guò)程,負(fù)責(zé)將操作和屏幕圖像保存在 sqlite 數(shù)據(jù)庫(kù)中以供以后訓(xùn)練使用。
- EIBot 板驅(qū)動(dòng)程序。
- 屏幕驅(qū)動(dòng)程序。
強(qiáng)化學(xué)習(xí)
人工智能的強(qiáng)化學(xué)習(xí)分支是最活躍的領(lǐng)域之一。該系統(tǒng)使用一種稱(chēng)為模仿學(xué)習(xí)的變體。我使用機(jī)器人操縱 iPhone 玩了數(shù)百場(chǎng) Doodle Jump 游戲。系統(tǒng)存檔圖像和我采取的行動(dòng)。這些圖像和動(dòng)作被用作神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集。在系統(tǒng)開(kāi)始做任何有意義的事情之前,它需要數(shù)千張訓(xùn)練圖像。目前該系統(tǒng)可以玩一個(gè)基本的游戲。它不會(huì)瘋狂??地按下按鈕或隨機(jī)搖動(dòng)屏幕。作為學(xué)習(xí)的一部分,我會(huì)盡可能及時(shí)地糾正錯(cuò)誤的決定。這些游戲和修正,以及隨機(jī)選擇的最后 20K 張圖像,在每次運(yùn)行后用作訓(xùn)練。
這個(gè)過(guò)程比我預(yù)期的要慢得多。我希望通過(guò)采用更復(fù)雜的學(xué)習(xí)模型來(lái)改進(jìn)事情,我希望讓系統(tǒng)松散以自行學(xué)習(xí)。
- 使用Matlab進(jìn)行強(qiáng)化學(xué)習(xí)電子版資源下載 0次下載
- 基于強(qiáng)化學(xué)習(xí)的虛擬場(chǎng)景角色乒乓球訓(xùn)練 62次下載
- 基于深度強(qiáng)化學(xué)習(xí)的無(wú)人機(jī)控制律設(shè)計(jì)方法 46次下載
- 一種新型的多智能體深度強(qiáng)化學(xué)習(xí)算法 36次下載
- 基于深度強(qiáng)化學(xué)習(xí)仿真集成的壓邊力控制模型 0次下載
- 基于強(qiáng)化學(xué)習(xí)的壯語(yǔ)詞標(biāo)注方法 14次下載
- 虛擬乒乓球手的強(qiáng)化學(xué)習(xí)模仿訓(xùn)練方法 12次下載
- 基于深度強(qiáng)化學(xué)習(xí)的路口單交叉信號(hào)控制 21次下載
- 強(qiáng)化學(xué)習(xí)的雙權(quán)重最小二乘Sarsa算法 5次下載
- 模型化深度強(qiáng)化學(xué)習(xí)應(yīng)用研究綜述 9次下載
- 機(jī)器學(xué)習(xí)中的無(wú)模型強(qiáng)化學(xué)習(xí)算法及研究綜述 11次下載
- 一種基于多智能體協(xié)同強(qiáng)化學(xué)習(xí)的多目標(biāo)追蹤方法 20次下載
- 人工智能到底是什么?什么工作需要學(xué)習(xí)人工智能 17次下載
- 人工智能深度學(xué)習(xí)處理架構(gòu)的演進(jìn)GPU功耗和延遲問(wèn)題如何解決 28次下載
- 強(qiáng)化學(xué)習(xí)在RoboCup帶球任務(wù)中的應(yīng)用劉飛 0次下載
- 通過(guò)強(qiáng)化學(xué)習(xí)策略進(jìn)行特征選擇 387次閱讀
- 機(jī)器學(xué)習(xí)是如何工作的? 人工智能與機(jī)器學(xué)習(xí)實(shí)例 2081次閱讀
- 懶惰強(qiáng)化學(xué)習(xí)算法在發(fā)電調(diào)控REG框架的應(yīng)用 936次閱讀
- 如何避開(kāi)人工智能的陷阱 1254次閱讀
- 對(duì)NAS任務(wù)中強(qiáng)化學(xué)習(xí)的效率進(jìn)行深入思考 5086次閱讀
- 量化深度強(qiáng)化學(xué)習(xí)算法的泛化能力 2423次閱讀
- 如何構(gòu)建強(qiáng)化學(xué)習(xí)模型來(lái)訓(xùn)練無(wú)人車(chē)算法 4911次閱讀
- 基于強(qiáng)化學(xué)習(xí)的MADDPG算法原理及實(shí)現(xiàn) 2.1w次閱讀
- 用PopArt進(jìn)行多任務(wù)深度強(qiáng)化學(xué)習(xí) 5699次閱讀
- 強(qiáng)化學(xué)習(xí)環(huán)境研究,智能體玩游戲?yàn)槭裁磪柡?/a> 3644次閱讀
- 什么是強(qiáng)化學(xué)習(xí)?純強(qiáng)化學(xué)習(xí)有意義嗎?強(qiáng)化學(xué)習(xí)有什么的致命缺陷? 1.7w次閱讀
- 探討機(jī)器學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、NLP、計(jì)算機(jī)視覺(jué)最新進(jìn)展 5624次閱讀
- 人工智能強(qiáng)化學(xué)習(xí)的原理和目標(biāo) 4948次閱讀
- 5個(gè)頂級(jí)的人工智能開(kāi)源工具 6240次閱讀
- 利用強(qiáng)化學(xué)習(xí)探索多巴胺對(duì)學(xué)習(xí)的作用 4750次閱讀
下載排行
本周
- 1人形機(jī)器人電機(jī)驅(qū)動(dòng)和傳感報(bào)告
- 4.27 MB | 9次下載 | 免費(fèi)
- 2Altium Designer元件庫(kù)
- 17.11 MB | 6次下載 | 免費(fèi)
- 324V2A開(kāi)關(guān)電源PCB資料分享
- 0.23 MB | 4次下載 | 1 積分
- 4GD100PIX120C6SNA規(guī)格書(shū)
- 0.98 MB | 3次下載 | 免費(fèi)
- 5Multisim模擬電路仿真教程
- 1.93 MB | 1次下載 | 3 積分
- 6BK7258英文規(guī)格書(shū)
- 1.67 MB | 1次下載 | 免費(fèi)
- 7RA4L1硬件手冊(cè)
- 21.89 MB | 1次下載 | 免費(fèi)
- 8RA4L1_SENSOR-V1原理圖
- 754.36 KB | 1次下載 | 免費(fèi)
本月
- 1晶體三極管的電流放大作用詳細(xì)說(shuō)明
- 0.77 MB | 32次下載 | 2 積分
- 2雙極型三極管放大電路的三種基本組態(tài)的學(xué)習(xí)課件免費(fèi)下載
- 4.03 MB | 25次下載 | 1 積分
- 3AIWA HS-J303 MKⅡ維修手冊(cè)
- 22.47 MB | 24次下載 | 10 積分
- 4九陽(yáng)豆?jié){機(jī)高清原理圖
- 2.47 MB | 23次下載 | 1 積分
- 5多級(jí)放大電路的學(xué)習(xí)課件免費(fèi)下載
- 1.81 MB | 21次下載 | 2 積分
- 6AIWA HS-J202/HS-J202M/HS-J800維修手冊(cè)
- 13.60 MB | 16次下載 | 10 積分
- 7東芝彩色電視機(jī)29SF6C維修說(shuō)明書(shū)
- 4.86 MB | 9次下載 | 1 積分
- 8人形機(jī)器人電機(jī)驅(qū)動(dòng)和傳感報(bào)告
- 4.27 MB | 9次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935127次下載 | 10 積分
- 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420063次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191382次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183338次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81586次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73814次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評(píng)論