注冊帳號丨忘記密碼?
1.點(diǎn)擊網(wǎng)站首頁右上角的“充值”按鈕可以為您的帳號充值
2.可選擇不同檔位的充值金額,充值后按篇按本計(jì)費(fèi)
3.充值成功后即可購買網(wǎng)站上的任意文章或雜志的電子版
4.購買后文章、雜志可在個(gè)人中心的訂閱/零買找到
5.登陸后可閱讀免費(fèi)專區(qū)的精彩內(nèi)容
打開文本圖片集
摘 要:針對策略未知逃逸無人機(jī)環(huán)境中多無人機(jī)協(xié)同追捕對抗任務(wù),提出P3C-MADDPG算法的多無人機(jī)協(xié)同追捕對抗策略。首先,為解決多智能體深度確定性策略梯度(Multi-Agent Deep Deterministic Policy Gradient,MADDPG)算法訓(xùn)練速度慢和Q值高估問題,在MADDPG算法中分別采用基于樹形結(jié)構(gòu)儲存的優(yōu)先經(jīng)驗(yàn)回放機(jī)制(Prioritized Experience Replay,PER)和設(shè)計(jì)的3線程并行Critic網(wǎng)絡(luò)模型,提出P3C-MADDPG算法。(剩余19170字)
登錄龍?jiān)雌诳W(wǎng)
購買文章
P3C-MADDPG算法的多無人機(jī)協(xié)同追捕對抗策略研究
文章價(jià)格:6.00元
當(dāng)前余額:100.00
閱讀
您目前是文章會員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報(bào)電話:400-106-1235
舉報(bào)郵箱:[email protected]