資料介紹
針對(duì)確定性馬爾克夫決策過(guò)程,本文提出了一種基于支持樣本的快速增強(qiáng)學(xué)習(xí)算法。
文章首先把學(xué)習(xí)問(wèn)題形式化為一個(gè)確定性的馬爾可夫決策過(guò)程,并對(duì)問(wèn)題空間中每個(gè)狀態(tài)的總回報(bào)值進(jìn)行估計(jì),根據(jù)總回報(bào)估計(jì)值與累積總回報(bào)估計(jì)值的大小關(guān)系,提出了支持樣本的概念,即在大量的訓(xùn)練樣本中,提取出值得我們信賴的那些樣本;然后建立狀態(tài)空間與動(dòng)作空間之間的對(duì)應(yīng)關(guān)系,用得到的支持樣本進(jìn)行最小二乘逼近,得到了快速有效的策略函數(shù);最后,通過(guò)仿真實(shí)驗(yàn),證明了方法的有效性。
文章首先把學(xué)習(xí)問(wèn)題形式化為一個(gè)確定性的馬爾可夫決策過(guò)程,并對(duì)問(wèn)題空間中每個(gè)狀態(tài)的總回報(bào)值進(jìn)行估計(jì),根據(jù)總回報(bào)估計(jì)值與累積總回報(bào)估計(jì)值的大小關(guān)系,提出了支持樣本的概念,即在大量的訓(xùn)練樣本中,提取出值得我們信賴的那些樣本;然后建立狀態(tài)空間與動(dòng)作空間之間的對(duì)應(yīng)關(guān)系,用得到的支持樣本進(jìn)行最小二乘逼近,得到了快速有效的策略函數(shù);最后,通過(guò)仿真實(shí)驗(yàn),證明了方法的有效性。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 一種基于Q學(xué)習(xí)算法的增量分類模型 3次下載
- 最小內(nèi)內(nèi)方差支持向量引導(dǎo)的字典學(xué)習(xí)算法 7次下載
- 機(jī)器學(xué)習(xí)的訓(xùn)練樣本數(shù)據(jù)選擇方法綜述 8次下載
- 基于深度學(xué)習(xí)的自然語(yǔ)言處理對(duì)抗樣本模型 39次下載
- 基于近鄰傳輸?shù)牧6?b class="flag-6" style="color: red">支持向量機(jī)學(xué)習(xí)算法 9次下載
- 基于共識(shí)率和加權(quán)樣本的標(biāo)記傳播算法CRLP 5次下載
- 基于深度學(xué)習(xí)的X射線胸部疾病診斷算法 17次下載
- 一種針對(duì)小樣本學(xué)習(xí)的雙路特征聚合網(wǎng)絡(luò) 9次下載
- 一個(gè)有效的快速迭代學(xué)習(xí)控制算法設(shè)計(jì)說(shuō)明 4次下載
- 用于自步學(xué)習(xí)的無(wú)監(jiān)督屬性選擇算法資料介紹 5次下載
- 機(jī)器學(xué)習(xí)教程之使用matlab研究機(jī)器學(xué)習(xí)的資料概述 32次下載
- 如何提高復(fù)雜環(huán)境下的人臉識(shí)別的增強(qiáng)算法資料概述 8次下載
- 基于自適應(yīng)探索改進(jìn)的深度增強(qiáng)學(xué)習(xí)算法 1次下載
- 基于增強(qiáng)學(xué)習(xí)算法的PID參數(shù)調(diào)整方法研究
- 一種基于類支持度的增量貝葉斯學(xué)習(xí)算法
- 機(jī)器學(xué)習(xí)算法原理詳解 1235次閱讀
- 單樣本微調(diào)給ChatGLM2注入知識(shí) 3075次閱讀
- 小樣本學(xué)習(xí)領(lǐng)域的未來(lái)發(fā)展方向 872次閱讀
- 機(jī)器學(xué)習(xí)相關(guān)介紹:支持向量機(jī)(低維到高維的映射) 2215次閱讀
- 常見(jiàn)的小樣本學(xué)習(xí)方法 2003次閱讀
- 機(jī)器學(xué)習(xí)算法的基礎(chǔ)介紹 1978次閱讀
- CFA二級(jí)思維導(dǎo)圖分享:機(jī)器學(xué)習(xí) 1786次閱讀
- 對(duì)抗樣本真的是bug嗎?對(duì)抗樣本不是Bug, 它們是特征 4668次閱讀
- 如何構(gòu)建強(qiáng)化學(xué)習(xí)模型來(lái)訓(xùn)練無(wú)人車(chē)算法 4911次閱讀
- kNN算法是監(jiān)督學(xué)習(xí)中分類方法的一種 1.1w次閱讀
- 自動(dòng)駕駛中機(jī)器學(xué)習(xí)算法主要分為哪四類? 6391次閱讀
- Q Learning算法學(xué)習(xí) 3692次閱讀
- 機(jī)器學(xué)習(xí)算法之基于黑盒語(yǔ)音識(shí)別的目標(biāo)對(duì)抗樣本 3417次閱讀
- 機(jī)器學(xué)習(xí)-8. 支持向量機(jī)(SVMs)概述和計(jì)算 5250次閱讀
- 基于圖像增強(qiáng)的去霧快速算法的FPGA實(shí)現(xiàn) 5406次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費(fèi)下載
- 0.00 MB | 1490次下載 | 免費(fèi)
- 2單片機(jī)典型實(shí)例介紹
- 18.19 MB | 93次下載 | 1 積分
- 3S7-200PLC編程實(shí)例詳細(xì)資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識(shí)別和講解說(shuō)明
- 4.28 MB | 18次下載 | 4 積分
- 5開(kāi)關(guān)電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費(fèi)
- 6基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
- 0.11 MB | 4次下載 | 免費(fèi)
- 7基于單片機(jī)和 SG3525的程控開(kāi)關(guān)電源設(shè)計(jì)
- 0.23 MB | 3次下載 | 免費(fèi)
- 8基于單片機(jī)的紅外風(fēng)扇遙控
- 0.23 MB | 3次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費(fèi)
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費(fèi)
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費(fèi)
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費(fèi)
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費(fèi)
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費(fèi)
- 8開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21539次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537791次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191183次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183277次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138039次下載 | 免費(fèi)
評(píng)論