悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

P3C-MADDPG算法的多無人機(jī)協(xié)同追捕對抗策略研究

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘 要:針對策略未知逃逸無人機(jī)環(huán)境中多無人機(jī)協(xié)同追捕對抗任務(wù),提出P3C-MADDPG算法的多無人機(jī)協(xié)同追捕對抗策略。首先,為解決多智能體深度確定性策略梯度(Multi-Agent Deep Deterministic Policy Gradient,MADDPG)算法訓(xùn)練速度慢和Q值高估問題,在MADDPG算法中分別采用基于樹形結(jié)構(gòu)儲存的優(yōu)先經(jīng)驗(yàn)回放機(jī)制(Prioritized Experience Replay,PER)和設(shè)計(jì)的3線程并行Critic網(wǎng)絡(luò)模型,提出P3C-MADDPG算法。(剩余19170字)

monitor