迭代學習控制(iterative learning control,簡稱ILC)由Arimoto等人于1984年正式提出,它是指不斷重復一個同樣軌跡的控制嘗試,并以此修正控制律,以得到非常好的控制效果的控制方法。迭代學習控制是學習控制的一個重要分支,是一種新型學習控制策略。它通過反復應用先前試驗得到的信息來獲得能夠產(chǎn)生期望輸出軌跡的控制輸入,以改善控制質量。與傳統(tǒng)的控制方法不同的是,迭代學習控制能以非常簡單的方式處理不確定度相當高的動態(tài)系統(tǒng),且僅需較少的先驗知識和計算量,同時適應性強,易于實現(xiàn);更主要的是,它不依賴于動態(tài)系統(tǒng)的精確數(shù)學模型,是一種以迭代產(chǎn)生優(yōu)化輸入信號,使系統(tǒng)輸出盡可能逼近理想值的算法。它的研究對那些有著非線性、復雜性、難以建模以及高精度軌跡控制問題有著非常重要的意義。
前饋式學習控制結構
針對設計部分依賴、不完全依賴和不依賴受控系統(tǒng)數(shù)學模型的控制系統(tǒng),國內外控制理論界做了多年的努力,發(fā)展了許多理論和方法。例如專家系統(tǒng)、模糊控制[1]、神經(jīng)網(wǎng)絡、多模型方法等。最近無模型自適應控制理論得到了廣泛的應用,該控制器的設計和分析不需要已知系統(tǒng)的任何知識,僅依賴于系統(tǒng)的輸入輸出數(shù)據(jù),與模型結構、系統(tǒng)階數(shù)均無關。
迭代學習控制(ILC)可利用以前操作的信息修正當前控制行為,提高控制性能,可以實現(xiàn)有限時間區(qū)間上的完全跟蹤任務,近十幾年來得到了廣泛的研究[。池榮虎將非參數(shù)自適應控制(NP-AC)的基本思想和分析手段引入到學習過程中,提出了一種新的無模型自適應迭代學習控制方案(MF-AILC)。考慮如下一般非線性離散時間SISO系統(tǒng):
這種控制方案只需系統(tǒng)的輸入輸出數(shù)據(jù),與系統(tǒng)的模型結構、系統(tǒng)階數(shù)無關。
神經(jīng)網(wǎng)絡是借鑒于生物神經(jīng)網(wǎng)絡而發(fā)展起來的新型智能信息處理系統(tǒng),可作為一般的函數(shù)估計器,有較強的自學習、自組織與自適應性,能夠用數(shù)理方法從信息處理的角度對人腦神經(jīng)網(wǎng)絡進行抽象,并建立某種簡化模型。模糊神經(jīng)網(wǎng)絡將神經(jīng)網(wǎng)絡與模糊邏輯[5]相結合,這種結合給智能系統(tǒng)提供了一個新的研究方向[6]。
根據(jù)系統(tǒng)的運行狀態(tài),調整控制器的參數(shù)-擬偽偏導數(shù)θ(k,t),以達到某種性能指標的最優(yōu)化,使輸出層的輸出對應于擬偽偏導數(shù)θ(k,t),通過神經(jīng)網(wǎng)絡的自身學習、加權系數(shù)調整,使其穩(wěn)定狀態(tài)對應于某種最優(yōu)控制律下的無模型自適應控制器的參數(shù)。利用模糊控制的魯棒性和非線性控制作用,對神經(jīng)網(wǎng)絡NN的輸入進行預處理,避免了當神經(jīng)網(wǎng)絡用Sigmoid函數(shù)或雙曲正切函數(shù)時,由于輸入過大易導致輸出趨于飽和使得對輸入不再敏感。
2 算法實現(xiàn)
BP算法是學習過程由信號的正向傳播與誤差的反向傳播兩個過程組成。正向傳播時,輸入樣本從輸入層傳人,經(jīng)各隱層逐層處理后,傳向輸出層。若輸出層的實際輸出與期望的輸出(教師信號)不符,則轉入誤差的反向傳播階段。誤差反傳是將輸出誤差以某種形式通過隱層向輸入層逐層反傳,并將誤差分攤給各層的所有單元,從而獲得各層單元的誤差信號,此誤差信號即作為修正各單元權值的依據(jù)。這種信號正向傳播與誤差反向傳播的各層權值調整過程,是周而復始地進行的。權值不斷調整的過程,也就是網(wǎng)絡的學習訓練過程。此過程一直進行到網(wǎng)絡輸出的誤差減少到可接受的程度,或進行到預先設定的學習次數(shù)為止。
2.1 BP神經(jīng)網(wǎng)絡
三層BP神經(jīng)網(wǎng)絡,有M個輸入節(jié)點、Q個隱層節(jié)點、一個輸出節(jié)點,輸出節(jié)點對應無模型自適應迭代學習控制器的逆為偏導數(shù)θ(k,t),輸出層和隱層的神經(jīng)元的激勵函數(shù)可取正負對稱的Sigmoid函數(shù)。
BP網(wǎng)絡的前向計算和加權系數(shù)修正迭代算法如下:
輸入節(jié)點對應經(jīng)模糊量化處理后的系統(tǒng)狀態(tài)變量:
將BP神經(jīng)網(wǎng)絡、模糊理論及無模型自適應迭代學習相結合,構造出了一種基于BP神經(jīng)網(wǎng)絡的模糊無模型自適應迭代學習控制器。該控制器綜合了三者的優(yōu)點,利用有著較強的非線性逼近性的BP神經(jīng)網(wǎng)絡學習逆?zhèn)纹珜?shù)。迭代學習控制適用于具有重復運動性質的被控系統(tǒng),它的目標是實現(xiàn)有線區(qū)間上的完全跟蹤任務。它通過對被控系統(tǒng)進行控制嘗試,以輸出信號與給定目標的偏差修正不理想的控制信號,使得系統(tǒng)的跟蹤性能得以提高。迭代學習控制的研究對具有較強的非線性耦合、較高的位置重復精度、難以建模和高精度軌跡跟蹤控制要求的動力學系統(tǒng)有著非常重要的意義。
-
控制器
+關注
關注
114文章
16854瀏覽量
182364 -
神經(jīng)網(wǎng)絡
+關注
關注
42文章
4797瀏覽量
102414 -
處理系統(tǒng)
+關注
關注
0文章
93瀏覽量
16856
發(fā)布評論請先 登錄
神經(jīng)網(wǎng)絡教程(李亞非)
【案例分享】基于BP算法的前饋神經(jīng)網(wǎng)絡
BP神經(jīng)網(wǎng)絡PID控制電機模型仿真
基于BP神經(jīng)網(wǎng)絡控制+Simulink雙閉環(huán)直流調速系統(tǒng)仿真設計
基于BP神經(jīng)網(wǎng)絡的PID控制
加工過程的神經(jīng)網(wǎng)絡模型參考自適應控制
基于BP神經(jīng)網(wǎng)絡的PID控制器參數(shù)優(yōu)化方法

一種改進的自適應遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡

基于擴展反向傳播神經(jīng)網(wǎng)絡的自適應控制方法
如何使用S函數(shù)實現(xiàn)BP神經(jīng)網(wǎng)絡PID控制器及Simulink仿真的資料說明

評論