基于魯棒觀測(cè)器的深度強(qiáng)化學(xué)習(xí)垂直起降運(yùn)載器姿態(tài)穩(wěn)定研究

打印
收藏

收藏成功

微博 QQ空間微信

打開文本圖片集

摘要：針對(duì)考慮彈性振動(dòng)、模型不確定干擾下的垂直起降運(yùn)載器姿態(tài)穩(wěn)定問題，將魯棒觀測(cè)器和深度強(qiáng)化學(xué)習(xí)中的近端策略優(yōu)化算法相結(jié)合，研究了一種基于魯棒觀測(cè)器的近端策略優(yōu)化（robust observer-based proximal policy optimization， ROB-PPO）方法。該方法設(shè)計(jì)魯棒觀測(cè)器重構(gòu)受彈性振動(dòng)干擾的運(yùn)載器姿態(tài)信息，將魯棒觀測(cè)器與運(yùn)載器動(dòng)力學(xué)模型組成環(huán)境，將魯棒觀測(cè)器得到的重構(gòu)姿態(tài)作為深度強(qiáng)化學(xué)習(xí)算法的狀態(tài)，使得深度強(qiáng)化學(xué)習(xí)智能體與之不斷交互，從而訓(xùn)練智能體控制運(yùn)載器姿態(tài)穩(wěn)定。（剩余18414字）

試讀結(jié)束

購買全文6.00元下一篇異構(gòu)編隊(duì)衛(wèi)星近距離操作軌跡規(guī)劃方法

系統(tǒng)工程與電子技術(shù)

2024年03期

￥24.00/本

悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于魯棒觀測(cè)器的深度強(qiáng)化學(xué)習(xí)垂直起降運(yùn)載器姿態(tài)穩(wěn)定研究