基于MATD3的視距內協同空戰(zhàn)機動決策
打開文本圖片集
摘 要:為提升多無人作戰(zhàn)飛機空戰(zhàn)的協同作戰(zhàn)能力, 提出一種基于多智能體雙延遲深度確定性策略梯度(MATD3)的協同空戰(zhàn)機動決策方法。 首先, 基于無人作戰(zhàn)飛機的三自由度動力學模型構建空戰(zhàn)環(huán)境, 并結合飛行員的操縱方式, 設計以控制量的變化量表示的動作空間。 其次, 優(yōu)化了狀態(tài)空間和獎勵函數的設計, 將友機與敵機的相對關系引入狀態(tài)空間, 根據相對角度、 相對距離等空戰(zhàn)態(tài)勢因素建立連續(xù)型獎勵函數, 將飛行約束條件融入離散型獎勵函數, 提升機動決策的準確性和機動飛行的安全性; 采用分階段訓練、 啟發(fā)式引導、 雙探索機制、 交替凍結博弈等訓練方法, 提高算法的收斂速度和機動策略的魯棒性。(剩余14425字)