P3C-MADDPG算法的多無人機(jī)協(xié)同追捕對抗策略研究

打印
收藏

收藏成功

微博 QQ空間微信

打開文本圖片集

摘要：針對策略未知逃逸無人機(jī)環(huán)境中多無人機(jī)協(xié)同追捕對抗任務(wù)，提出P3C-MADDPG算法的多無人機(jī)協(xié)同追捕對抗策略。首先，為解決多智能體深度確定性策略梯度（Multi-Agent Deep Deterministic Policy Gradient，MADDPG）算法訓(xùn)練速度慢和Q值高估問題，在MADDPG算法中分別采用基于樹形結(jié)構(gòu)儲存的優(yōu)先經(jīng)驗(yàn)回放機(jī)制（Prioritized Experience Replay，PER）和設(shè)計(jì)的3線程并行Critic網(wǎng)絡(luò)模型，提出P3C-MADDPG算法。（剩余19170字）

試讀結(jié)束

購買全文6.00元下一篇俄烏沖突中俄空天軍直升機(jī)運(yùn)用對直升機(jī)裝備建設(shè)的啟示

指揮控制與仿真

2023年06期

￥18.00/本

悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

P3C-MADDPG算法的多無人機(jī)協(xié)同追捕對抗策略研究