完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 強化學(xué)習(xí)
文章:225個 瀏覽:11599次 帖子:1個
深度強化學(xué)習(xí)已經(jīng)達(dá)到了盡頭?
不可否認(rèn),深度學(xué)習(xí)的熱度已經(jīng)大大下降,贊美深度學(xué)習(xí)作為AI終極算法的推文少得多了,而且論文正在變得不那么“革命”,現(xiàn)在大家換了個詞,叫:進(jìn)化。
2019-04-29 標(biāo)簽:人工智能自動駕駛強化學(xué)習(xí) 3564 0
機器人擁有人一樣的意識,一直是我們目前難以攻克的難題。在近日,加州大學(xué)伯克利分校的科學(xué)家和谷歌人工智能(AI)研究部門之一的Google Brain在A...
2019-01-03 標(biāo)簽:機器人強化學(xué)習(xí) 3547 0
如果不避讓就會撞上一群人,避讓就會撞上另一個人,它應(yīng)該避開人群嗎?它應(yīng)該保護(hù)乘客,還是保護(hù)行人?它應(yīng)該保護(hù)年輕人還是老年人?盡管這些情況極為罕見,但很顯...
2018-11-12 標(biāo)簽:谷歌AI強化學(xué)習(xí) 3538 0
在幫助計算機視覺模型識別被操縱物體的樣子之后,研究人員轉(zhuǎn)而進(jìn)行了艱苦的工作,即使用384臺機器來訓(xùn)練模型,以使用模擬的攝像機圖像來預(yù)測物體的方向。為了加...
2018-08-01 標(biāo)簽:機器人計算機視覺強化學(xué)習(xí) 3524 0
AlphaGo首席研究員談強化學(xué)習(xí)十大黃金法則!
Silver的演講中提出的強化學(xué)習(xí)10大要點涵蓋涉及算法評估、狀態(tài)控制、建模函數(shù)等方面的心得和建議,非常值得開發(fā)者和機器學(xué)習(xí)愛好者參考學(xué)習(xí)。一起看看他是...
2018-09-17 標(biāo)簽:谷歌強化學(xué)習(xí)DeepMind 3502 0
深度強化學(xué)習(xí)打造的ANYmal登上Science子刊,真的超越了波士頓動力!
習(xí)得運動控制器的量化評估結(jié)果。A. 發(fā)現(xiàn)的步態(tài)模式按速度指令以 1.0 m/s 的速度運行。LF 表示左前腿,RF 表示右前腿,LH 表示左后腿,RH ...
2019-01-28 標(biāo)簽:強化學(xué)習(xí)ai技術(shù)波士頓動力 3416 0
博士生David Abel詳細(xì)整理了一份87頁的ICML大會筆記
很多博士生可能覺得論文眼花繚亂看都不看不過來,更不要說整理出一份詳細(xì)的筆記。而對很多還沒有機會參加 ICML 這樣頂級大會的人來說,顯然,David A...
2019-07-18 標(biāo)簽:計算機科學(xué)機器學(xué)習(xí)強化學(xué)習(xí) 3380 0
中國電子學(xué)會發(fā)布十項最具成長性的AI技術(shù)
為加強對新一代人工智能技術(shù)的前瞻預(yù)判,把握全球技術(shù)創(chuàng)新動態(tài)及發(fā)展趨勢,中國電子學(xué)會近期走訪人工智能相關(guān)企業(yè)及高校院所專家,遴選發(fā)布了十項最具特色的成長性技術(shù)。
2018-09-01 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)人工智能強化學(xué)習(xí) 3316 0
70年來AI研究方面的苦澀教訓(xùn):我們過于依靠人類知識了
Sutton認(rèn)為,過去70年來,AI研究走過的最大彎路,就是過于重視人類既有經(jīng)驗和知識,研究人員在訓(xùn)練AI模型時,往往想將人類知識灌輸給智能體,而不是讓...
2019-03-18 標(biāo)簽:AI智能體強化學(xué)習(xí) 3280 0
谷歌提出元獎勵學(xué)習(xí),兩大基準(zhǔn)測試刷新最優(yōu)結(jié)果
重要的是,由于獎勵不明確,智能體可能會收到“利用環(huán)境中的虛假模式”的正反饋,這就有可能導(dǎo)致獎勵黑客攻擊,在實際系統(tǒng)中部署時會導(dǎo)致意外和有害的行為。
2019-02-24 標(biāo)簽:谷歌智能體強化學(xué)習(xí) 3185 0
基于PPO強化學(xué)習(xí)算法的AI應(yīng)用案例
Viet Nguyen就是其中一個。這位來自德國的程序員表示自己只玩到了第9個關(guān)卡。因此,他決定利用強化學(xué)習(xí)AI算法來幫他完成未通關(guān)的遺憾。
2020-07-29 標(biāo)簽:算法AI強化學(xué)習(xí) 3180 0
包括DeepMind在內(nèi)的世界頂尖AI團(tuán)隊也在攻堅《星際爭霸II》。其背后擁有一個共同的終極目標(biāo)——進(jìn)一步拓展AI邊界,并為最終達(dá)到通用人工智能(AGI...
2019-09-13 標(biāo)簽:AI強化學(xué)習(xí)DeepMind 3166 0
谷歌最近提出一種新的強化學(xué)習(xí)算法:模擬策略學(xué)習(xí) (SimPLe)
為了訓(xùn)練一個玩 Atari 游戲的模型,我們首先需要在像素空間中生成合理的未來版本。換句話說,我們通過將一系列已經(jīng)觀察到的幀和給到游戲的命令 (如 “左...
2019-03-29 標(biāo)簽:谷歌算法強化學(xué)習(xí) 3146 0
事實上,人可以根據(jù)即將到來的幾個箱子的形狀尺寸,很快地做出決策,并不需要、也無法做到對整個箱子序列的全局規(guī)劃。這種僅僅看到部分箱子序列的裝箱問題,稱為在...
2021-01-27 標(biāo)簽:機器人算法強化學(xué)習(xí) 3117 0
你們不是嫌棄世界冠軍OG團(tuán)隊實力太水嗎?“你行你上”的機會來了
對于 OpenAI Five 競技場模式,有很多人報以期待,reddit 上有網(wǎng)友評論稱,“這特么太酷了,自從 OpenAI 1v1 首秀之后,人們已經(jīng)...
2019-04-22 標(biāo)簽:機器人智能體強化學(xué)習(xí) 3104 0
70年來,人們在AI領(lǐng)域“一直連續(xù)犯著同樣的錯誤”
就像在棋類游戲中一樣,研究人員總是試圖讓系統(tǒng)按照他們心目中的人類的思維方式工作,試圖把這些知識放進(jìn)計算機的系統(tǒng)里。但最終,當(dāng)摩爾定律帶來大規(guī)模算力,其他...
2019-03-26 標(biāo)簽:摩爾定律深度學(xué)習(xí)強化學(xué)習(xí) 2968 0
Reaver在《星際爭霸 II》各種小型游戲上與其他AI的性能對比
“對于業(yè)余愛好者而言,只要對 Reaver 稍作修改(例如超參數(shù)),就能得到訓(xùn)練深度強化學(xué)習(xí)智能體的所有必須工具。對于經(jīng)驗豐富的研究人員,Reaver ...
2018-11-29 標(biāo)簽:強化學(xué)習(xí)GithubAI算法 2897 0
樹枝也能制造機器人?日本創(chuàng)新機器人自主學(xué)會走路
近日,日本研究人員公開了一種使用樹枝制造而成的機器人,可以通過強化學(xué)習(xí),學(xué)會自主移動。
2019-07-09 標(biāo)簽:機器人強化學(xué)習(xí) 2897 0
如何將強化學(xué)習(xí)用于火箭發(fā)動機引擎研發(fā)的創(chuàng)新解決方案中
機器學(xué)習(xí)(ML)在各個行業(yè)以及眾多的應(yīng)用軟件中產(chǎn)生了令人難以置信的影響,其中包括個性化電視推薦和順風(fēng)車應(yīng)用中的動態(tài)價格模型等。
2019-04-29 標(biāo)簽:火箭發(fā)動機強化學(xué)習(xí) 2753 0
當(dāng)機器人遇見強化學(xué)習(xí),會碰出怎樣的火花?
當(dāng)機器人遇見強化學(xué)習(xí),會碰出怎樣的火花? 一名叫 Cassie 的機器人,給出了生動演繹。 最近,24 歲的中國南昌小伙李鐘毓和其所在團(tuán)隊,用強化學(xué)習(xí)教...
2021-04-13 標(biāo)簽:機器人強化學(xué)習(xí) 2733 0
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
電機控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無刷電機 | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機 | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機 | SPWM | 充電樁 | IPM | 機器視覺 | 無人機 | 三菱電機 | ST |
伺服電機 | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |