完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 強(qiáng)化學(xué)習(xí)
文章:225個(gè) 瀏覽:11599次 帖子:1個(gè)
知名創(chuàng)投研究機(jī)構(gòu)CB Insights調(diào)研了25種最大的AI趨勢,以確定2019年該技術(shù)的下一步趨勢,他們根據(jù)行業(yè)采用率和市場優(yōu)勢評估了每種趨勢,并將其...
2019-02-25 標(biāo)簽:人工智能開源強(qiáng)化學(xué)習(xí) 4720 0
簡單隨機(jī)搜索:無模型強(qiáng)化學(xué)習(xí)的高效途徑
讓我們在強(qiáng)化學(xué)習(xí)社區(qū)感興趣的問題上應(yīng)用隨機(jī)搜索。深度強(qiáng)化學(xué)習(xí)領(lǐng)域一直把大量時(shí)間和精力用于由OpenAI維護(hù)的、基于MuJoCo模擬器的一套基準(zhǔn)測試中。這...
2018-04-01 標(biāo)簽:強(qiáng)化學(xué)習(xí) 4674 0
OpenAI宣布他們的AI僅通過一次人類演示,蒙特祖瑪?shù)膹?fù)仇游戲中玩出歷史最高分
這次,OpenAI的研究團(tuán)隊(duì)訓(xùn)練了一個(gè)智能體,僅通過一次人類demo,就在蒙特祖瑪?shù)膹?fù)仇游戲中獲得了74500分的成績,比以往公布的任何結(jié)果都要好。
2018-07-09 標(biāo)簽:算法智能體強(qiáng)化學(xué)習(xí) 4583 0
上海的谷歌開發(fā)者大會還沒結(jié)束,14日,在北京,谷歌也舉行了一個(gè)小范圍的面向?qū)W生的宣講,李飛飛教授出席。昨天在上海,主旨演講后,李飛飛和李佳等谷歌的AI研...
2017-12-28 標(biāo)簽:AI深度學(xué)習(xí)強(qiáng)化學(xué)習(xí) 4478 0
谷歌AI發(fā)布足球游戲強(qiáng)化學(xué)習(xí)訓(xùn)練環(huán)境“足球引擎”
該強(qiáng)化學(xué)習(xí)環(huán)境的核心是一種先進(jìn)的足球游戲模擬,稱為“足球引擎”,它基于一個(gè)足球游戲版本經(jīng)大量修改而成。根據(jù)兩支對方球隊(duì)的輸入動作,模擬了足球比賽中的常見...
2019-06-15 標(biāo)簽:谷歌AI強(qiáng)化學(xué)習(xí) 4461 0
圖解大模型RLHF系列之:人人都能看懂的PPO原理與源碼解讀
回想一下我們對NLP任務(wù)做強(qiáng)化學(xué)習(xí)(RLHF)的目的:我們希望給模型一個(gè)prompt,讓模型能生成符合人類喜好的response。再回想一下gpt模型做...
2024-01-14 標(biāo)簽:源碼強(qiáng)化學(xué)習(xí)大模型 4229 0
只有提高算力才能發(fā)展AI? 強(qiáng)化學(xué)習(xí)之父薩頓與牛津教授掀起隔空論戰(zhàn)
關(guān)系到AI的方向問題!
2019-03-25 標(biāo)簽:AI強(qiáng)化學(xué)習(xí) 4193 0
簡單來說就是,不管你是亞馬遜云、微軟云、谷歌云、阿里云還是 IBM 云,公有云、私有云還是混合云,Watson 微服務(wù)都能跑。這就使得那些使用 Wats...
2019-02-18 標(biāo)簽:IBMAI強(qiáng)化學(xué)習(xí) 4158 0
微軟亞洲研究院開發(fā)的麻將AI系統(tǒng)Suphx成為首個(gè)在國際知名專業(yè)麻將平臺“天鳳”
2019-09-13 標(biāo)簽:微軟AI強(qiáng)化學(xué)習(xí) 3986 0
除此之外,這場比賽與正常的Dota 2比賽一樣,其最終目標(biāo)是摧毀敵方隊(duì)伍的“基地”,即每個(gè)團(tuán)隊(duì)領(lǐng)土末端的大型塔樓,在敵人的隊(duì)伍成功摧毀其他小型塔后,基地...
2019-04-19 標(biāo)簽:機(jī)器人AI強(qiáng)化學(xué)習(xí) 3967 0
2018-2019年十項(xiàng)最具特色的成長性技術(shù)的AI技術(shù)
膠囊網(wǎng)絡(luò)。是指在深度神經(jīng)網(wǎng)絡(luò)中構(gòu)建多層神經(jīng)元模塊,用以發(fā)現(xiàn)并存儲物體詳細(xì)空間位置和姿態(tài)等信息的技術(shù)。該技術(shù)能使機(jī)器在樣本數(shù)據(jù)較少情形下,快速識別不同情境...
2018-08-19 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)人工智能強(qiáng)化學(xué)習(xí) 3931 0
不像現(xiàn)在的許多四足機(jī)器人,ANYmal有防水能力,是專門為穿越不太理想的環(huán)境而設(shè)計(jì)的,比如森林、工業(yè)場所和雪地。根據(jù)ANYbotics的說法,這款機(jī)器人...
2019-01-21 標(biāo)簽:強(qiáng)化學(xué)習(xí)波士頓動力機(jī)器狗 3922 0
谷歌推出新的基于Tensorflow的強(qiáng)化學(xué)習(xí)框架,稱為Dopamine
強(qiáng)化學(xué)習(xí)(RL)研究在過去幾年取得了許多重大進(jìn)展。強(qiáng)化學(xué)習(xí)的進(jìn)步使得 AI 智能體能夠在一些游戲上超過人類,值得關(guān)注的例子包括 DeepMind 攻破 ...
2018-08-31 標(biāo)簽:谷歌強(qiáng)化學(xué)習(xí) 3916 0
人工智能的強(qiáng)化學(xué)習(xí)要點(diǎn)
強(qiáng)化學(xué)習(xí)(RL)是現(xiàn)代人工智能領(lǐng)域中最熱門的研究主題之一,其普及度還在不斷增長。 讓我們看一下開始學(xué)習(xí)RL需要了解的5件事。
2020-05-04 標(biāo)簽:人工智能強(qiáng)化學(xué)習(xí) 3843 0
AAAI19的教程在27號和28號舉行,基本上包括了人工智能基礎(chǔ)研究領(lǐng)域近年來的最新進(jìn)展。在教程中可以學(xué)習(xí)到對于某個(gè)細(xì)分領(lǐng)域問題的理論框架和模型工具。無...
2019-01-29 標(biāo)簽:人工智能智慧城市強(qiáng)化學(xué)習(xí) 3735 0
ICLR 2019共接收1591篇投稿,創(chuàng)下歷年新高
我建議你們將會議視為一種“必須申請的免費(fèi)推廣機(jī)會”,它會對已經(jīng)很好的論文有幫助,但評分多少并沒有論文的實(shí)際影響那么重要。如果以后每個(gè)人都開始使用你的re...
2018-11-08 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)GAN強(qiáng)化學(xué)習(xí) 3713 0
一個(gè)基于TF2.0的強(qiáng)化學(xué)習(xí)訓(xùn)練工具
目前,Huskarl 已經(jīng)支持了 DQN(Deep Q-Learning Network)、Multi-step DQN、Double DQN、A2C(...
2019-02-25 標(biāo)簽:強(qiáng)化學(xué)習(xí)tensorflow開源工具 3677 0
韓國科學(xué)技術(shù)院(KAIST)上周在大田市舉辦了“人工智能世界杯”,證明人工智能已經(jīng)準(zhǔn)備好進(jìn)入足球世界。
2018-08-28 標(biāo)簽:人工智能強(qiáng)化學(xué)習(xí) 3617 0
谷歌、DeepMind重磅推出PlaNet 強(qiáng)化學(xué)習(xí)新突破
Google AI 與 DeepMind 合作推出深度規(guī)劃網(wǎng)絡(luò) (PlaNet),這是一個(gè)純粹基于模型的智能體,能從圖像輸入中學(xué)習(xí)世界模型,完成多項(xiàng)規(guī)劃...
2019-02-17 標(biāo)簽:谷歌強(qiáng)化學(xué)習(xí)DeepMind 3617 0
基于部分可觀察馬爾可夫決策過程思考自然語言處理和強(qiáng)化學(xué)習(xí)問題的一些想法
但是端到端世界的態(tài)度看起來是,既然我們不再進(jìn)行邏輯推理,那么我們完全沒有必要考慮含義。突然之間,所有人都喜歡稱引維特根斯坦,主張我們應(yīng)該以下游任務(wù)的成功...
2018-11-30 標(biāo)簽:強(qiáng)化學(xué)習(xí)自然語言處理 3589 0
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺 | 無人機(jī) | 三菱電機(jī) | ST |
伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |