迭代學(xué)習(xí)控制(iterative learning control,簡(jiǎn)稱ILC)由Arimoto等人于1984年正式提出,它是指不斷重復(fù)一個(gè)同樣軌跡的控制嘗試,并以此修正控制律,以得到非常好的控制效果的控制方法。迭代學(xué)習(xí)控制是學(xué)習(xí)控制的一個(gè)重要分支,是一種新型學(xué)習(xí)控制策略。它通過(guò)反復(fù)應(yīng)用先前試驗(yàn)得到的信息來(lái)獲得能夠產(chǎn)生期望輸出軌跡的控制輸入,以改善控制質(zhì)量。與傳統(tǒng)的控制方法不同的是,迭代學(xué)習(xí)控制能以非常簡(jiǎn)單的方式處理不確定度相當(dāng)高的動(dòng)態(tài)系統(tǒng),且僅需較少的先驗(yàn)知識(shí)和計(jì)算量,同時(shí)適應(yīng)性強(qiáng),易于實(shí)現(xiàn);更主要的是,它不依賴于動(dòng)態(tài)系統(tǒng)的精確數(shù)學(xué)模型,是一種以迭代產(chǎn)生優(yōu)化輸入信號(hào),使系統(tǒng)輸出盡可能逼近理想值的算法。它的研究對(duì)那些有著非線性、復(fù)雜性、難以建模以及高精度軌跡控制問(wèn)題有著非常重要的意義。
前饋式學(xué)習(xí)控制結(jié)構(gòu)
針對(duì)設(shè)計(jì)部分依賴、不完全依賴和不依賴受控系統(tǒng)數(shù)學(xué)模型的控制系統(tǒng),國(guó)內(nèi)外控制理論界做了多年的努力,發(fā)展了許多理論和方法。例如專家系統(tǒng)、模糊控制[1]、神經(jīng)網(wǎng)絡(luò)、多模型方法等。最近無(wú)模型自適應(yīng)控制理論得到了廣泛的應(yīng)用,該控制器的設(shè)計(jì)和分析不需要已知系統(tǒng)的任何知識(shí),僅依賴于系統(tǒng)的輸入輸出數(shù)據(jù),與模型結(jié)構(gòu)、系統(tǒng)階數(shù)均無(wú)關(guān)。
迭代學(xué)習(xí)控制(ILC)可利用以前操作的信息修正當(dāng)前控制行為,提高控制性能,可以實(shí)現(xiàn)有限時(shí)間區(qū)間上的完全跟蹤任務(wù),近十幾年來(lái)得到了廣泛的研究[。池榮虎將非參數(shù)自適應(yīng)控制(NP-AC)的基本思想和分析手段引入到學(xué)習(xí)過(guò)程中,提出了一種新的無(wú)模型自適應(yīng)迭代學(xué)習(xí)控制方案(MF-AILC)??紤]如下一般非線性離散時(shí)間SISO系統(tǒng):
這種控制方案只需系統(tǒng)的輸入輸出數(shù)據(jù),與系統(tǒng)的模型結(jié)構(gòu)、系統(tǒng)階數(shù)無(wú)關(guān)。
神經(jīng)網(wǎng)絡(luò)是借鑒于生物神經(jīng)網(wǎng)絡(luò)而發(fā)展起來(lái)的新型智能信息處理系統(tǒng),可作為一般的函數(shù)估計(jì)器,有較強(qiáng)的自學(xué)習(xí)、自組織與自適應(yīng)性,能夠用數(shù)理方法從信息處理的角度對(duì)人腦神經(jīng)網(wǎng)絡(luò)進(jìn)行抽象,并建立某種簡(jiǎn)化模型。模糊神經(jīng)網(wǎng)絡(luò)將神經(jīng)網(wǎng)絡(luò)與模糊邏輯[5]相結(jié)合,這種結(jié)合給智能系統(tǒng)提供了一個(gè)新的研究方向[6]。
根據(jù)系統(tǒng)的運(yùn)行狀態(tài),調(diào)整控制器的參數(shù)-擬偽偏導(dǎo)數(shù)θ(k,t),以達(dá)到某種性能指標(biāo)的最優(yōu)化,使輸出層的輸出對(duì)應(yīng)于擬偽偏導(dǎo)數(shù)θ(k,t),通過(guò)神經(jīng)網(wǎng)絡(luò)的自身學(xué)習(xí)、加權(quán)系數(shù)調(diào)整,使其穩(wěn)定狀態(tài)對(duì)應(yīng)于某種最優(yōu)控制律下的無(wú)模型自適應(yīng)控制器的參數(shù)。利用模糊控制的魯棒性和非線性控制作用,對(duì)神經(jīng)網(wǎng)絡(luò)NN的輸入進(jìn)行預(yù)處理,避免了當(dāng)神經(jīng)網(wǎng)絡(luò)用Sigmoid函數(shù)或雙曲正切函數(shù)時(shí),由于輸入過(guò)大易導(dǎo)致輸出趨于飽和使得對(duì)輸入不再敏感。
2 算法實(shí)現(xiàn)
BP算法是學(xué)習(xí)過(guò)程由信號(hào)的正向傳播與誤差的反向傳播兩個(gè)過(guò)程組成。正向傳播時(shí),輸入樣本從輸入層傳人,經(jīng)各隱層逐層處理后,傳向輸出層。若輸出層的實(shí)際輸出與期望的輸出(教師信號(hào))不符,則轉(zhuǎn)入誤差的反向傳播階段。誤差反傳是將輸出誤差以某種形式通過(guò)隱層向輸入層逐層反傳,并將誤差分?jǐn)偨o各層的所有單元,從而獲得各層單元的誤差信號(hào),此誤差信號(hào)即作為修正各單元權(quán)值的依據(jù)。這種信號(hào)正向傳播與誤差反向傳播的各層權(quán)值調(diào)整過(guò)程,是周而復(fù)始地進(jìn)行的。權(quán)值不斷調(diào)整的過(guò)程,也就是網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練過(guò)程。此過(guò)程一直進(jìn)行到網(wǎng)絡(luò)輸出的誤差減少到可接受的程度,或進(jìn)行到預(yù)先設(shè)定的學(xué)習(xí)次數(shù)為止。
2.1 BP神經(jīng)網(wǎng)絡(luò)
三層BP神經(jīng)網(wǎng)絡(luò),有M個(gè)輸入節(jié)點(diǎn)、Q個(gè)隱層節(jié)點(diǎn)、一個(gè)輸出節(jié)點(diǎn),輸出節(jié)點(diǎn)對(duì)應(yīng)無(wú)模型自適應(yīng)迭代學(xué)習(xí)控制器的逆為偏導(dǎo)數(shù)θ(k,t),輸出層和隱層的神經(jīng)元的激勵(lì)函數(shù)可取正負(fù)對(duì)稱的Sigmoid函數(shù)。
BP網(wǎng)絡(luò)的前向計(jì)算和加權(quán)系數(shù)修正迭代算法如下:
輸入節(jié)點(diǎn)對(duì)應(yīng)經(jīng)模糊量化處理后的系統(tǒng)狀態(tài)變量:
將BP神經(jīng)網(wǎng)絡(luò)、模糊理論及無(wú)模型自適應(yīng)迭代學(xué)習(xí)相結(jié)合,構(gòu)造出了一種基于BP神經(jīng)網(wǎng)絡(luò)的模糊無(wú)模型自適應(yīng)迭代學(xué)習(xí)控制器。該控制器綜合了三者的優(yōu)點(diǎn),利用有著較強(qiáng)的非線性逼近性的BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)逆?zhèn)纹珜?dǎo)數(shù)。迭代學(xué)習(xí)控制適用于具有重復(fù)運(yùn)動(dòng)性質(zhì)的被控系統(tǒng),它的目標(biāo)是實(shí)現(xiàn)有線區(qū)間上的完全跟蹤任務(wù)。它通過(guò)對(duì)被控系統(tǒng)進(jìn)行控制嘗試,以輸出信號(hào)與給定目標(biāo)的偏差修正不理想的控制信號(hào),使得系統(tǒng)的跟蹤性能得以提高。迭代學(xué)習(xí)控制的研究對(duì)具有較強(qiáng)的非線性耦合、較高的位置重復(fù)精度、難以建模和高精度軌跡跟蹤控制要求的動(dòng)力學(xué)系統(tǒng)有著非常重要的意義。
-
控制器
+關(guān)注
關(guān)注
114文章
17113瀏覽量
184384 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103670 -
處理系統(tǒng)
+關(guān)注
關(guān)注
0文章
93瀏覽量
16954
發(fā)布評(píng)論請(qǐng)先 登錄
神經(jīng)網(wǎng)絡(luò)教程(李亞非)
【案例分享】基于BP算法的前饋神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)PID控制電機(jī)模型仿真
基于BP神經(jīng)網(wǎng)絡(luò)控制+Simulink雙閉環(huán)直流調(diào)速系統(tǒng)仿真設(shè)計(jì)
基于BP神經(jīng)網(wǎng)絡(luò)的PID控制
加工過(guò)程的神經(jīng)網(wǎng)絡(luò)模型參考自適應(yīng)控制
基于BP神經(jīng)網(wǎng)絡(luò)的PID控制器參數(shù)優(yōu)化方法

BP神經(jīng)網(wǎng)絡(luò)模型與學(xué)習(xí)算法

一種改進(jìn)的自適應(yīng)遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)

基于擴(kuò)展反向傳播神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制方法
如何使用S函數(shù)實(shí)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)PID控制器及Simulink仿真的資料說(shuō)明

評(píng)論