悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

混合動(dòng)力系統(tǒng)偏好強(qiáng)化學(xué)習(xí)能量管理策略研究

  • 打印
  • 收藏
收藏成功


打開(kāi)文本圖片集

摘要: 為實(shí)現(xiàn)混合動(dòng)力系統(tǒng)在電池荷電狀態(tài)(state of charge,SOC)平衡以及動(dòng)力性約束下的經(jīng)濟(jì)性提升,提出了基于偏好強(qiáng)化學(xué)習(xí)的混合動(dòng)力能量管理策略,該策略將能量管理問(wèn)題建模為馬爾科夫決策過(guò)程,采用深度神經(jīng)網(wǎng)絡(luò)建立輸入狀態(tài)值到最優(yōu)動(dòng)作控制輸出的函數(shù)映射關(guān)系。與傳統(tǒng)的強(qiáng)化學(xué)習(xí)控制算法相比,偏好強(qiáng)化學(xué)習(xí)算法無(wú)需設(shè)定回報(bào)函數(shù),只需對(duì)多動(dòng)作進(jìn)行偏好判斷即可實(shí)現(xiàn)網(wǎng)絡(luò)訓(xùn)練收斂,克服了傳統(tǒng)強(qiáng)化學(xué)習(xí)方法中回報(bào)函數(shù)加權(quán)歸一化設(shè)計(jì)難題。(剩余11795字)

monitor