混合動(dòng)力系統(tǒng)偏好強(qiáng)化學(xué)習(xí)能量管理策略研究

打印
收藏

收藏成功

微博 QQ空間微信

打開(kāi)文本圖片集

摘要：為實(shí)現(xiàn)混合動(dòng)力系統(tǒng)在電池荷電狀態(tài)（state of charge，SOC）平衡以及動(dòng)力性約束下的經(jīng)濟(jì)性提升，提出了基于偏好強(qiáng)化學(xué)習(xí)的混合動(dòng)力能量管理策略，該策略將能量管理問(wèn)題建模為馬爾科夫決策過(guò)程，采用深度神經(jīng)網(wǎng)絡(luò)建立輸入狀態(tài)值到最優(yōu)動(dòng)作控制輸出的函數(shù)映射關(guān)系。與傳統(tǒng)的強(qiáng)化學(xué)習(xí)控制算法相比，偏好強(qiáng)化學(xué)習(xí)算法無(wú)需設(shè)定回報(bào)函數(shù)，只需對(duì)多動(dòng)作進(jìn)行偏好判斷即可實(shí)現(xiàn)網(wǎng)絡(luò)訓(xùn)練收斂，克服了傳統(tǒng)強(qiáng)化學(xué)習(xí)方法中回報(bào)函數(shù)加權(quán)歸一化設(shè)計(jì)難題。（剩余11795字）

試讀結(jié)束

購(gòu)買(mǎi)全文6.00元下一篇基于動(dòng)態(tài)遺忘因子遞推最小二乘法和改進(jìn)粒子濾波算法的鋰電池SOC估計(jì)

車(chē)用發(fā)動(dòng)機(jī)

2024年03期

￥12.00/本

悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

混合動(dòng)力系統(tǒng)偏好強(qiáng)化學(xué)習(xí)能量管理策略研究