悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

隨機(jī)線性二次問題中一類改進(jìn)的強(qiáng)化學(xué)習(xí)方法

  • 打印
  • 收藏
收藏成功

摘  要:隨機(jī)線性二次問題是一類重要且研究較為成熟的隨機(jī)控制問題。其中,部分信息條件下的隨機(jī)線性二次問題是指系統(tǒng)的狀態(tài)方程或代價(jià)函數(shù)中存在未知系數(shù)的情形,該文在前人工作的基礎(chǔ)上,改進(jìn)部分信息條件下線性二次問題的最優(yōu)控制在線強(qiáng)化學(xué)習(xí)算法。所研究系統(tǒng)方程和代價(jià)函數(shù)的系數(shù)都存在未知量,在此條件下,算法通過可觀察的樣本軌跡和回報(bào)函數(shù)求得最優(yōu)控制以及代價(jià)函數(shù)中的未知系數(shù),進(jìn)一步地,我們給出迭代過程收斂性與控制穩(wěn)定性的證明。(剩余4004字)

目錄
monitor