基于深度Q網絡的近距空戰(zhàn)智能機動決策研究
打開文本圖片集
摘 要:針對近距空戰(zhàn)對抗中無人機機動決策問題, 本文基于深度Q網絡(DQN)算法的框架, 對強化學習獎勵函數(shù)設計以及超參數(shù)的選擇問題進行了研究。 對于強化學習中的稀疏獎勵問題, 采用綜合角度、 距離、 高度和速度等空戰(zhàn)因素的輔助獎勵, 能夠精確描述空戰(zhàn)任務, 正確引導智能體的學習方向。 同時, 針對應用強化學習超參數(shù)選擇問題, 探究了學習率、 網絡節(jié)點數(shù)和網絡層數(shù)對決策系統(tǒng)的影響, 并給出較好的參數(shù)選擇范圍, 為后續(xù)研究參數(shù)選擇提供參考。(剩余13050字)