基于強化學(xué)習(xí)的智能空戰(zhàn)模型研究
打開文本圖片集
摘 要:人工智能的進步深刻改變了各行各業(yè),智能空戰(zhàn)就是其中的典型代表之一。根據(jù)空戰(zhàn)游戲的特點,構(gòu)建了智能空戰(zhàn)模型,主要包括樣本集合的獲取以及適用于空戰(zhàn)決策的網(wǎng)絡(luò)模型選擇。結(jié)合空戰(zhàn)連續(xù)狀態(tài)、連續(xù)動作、現(xiàn)有戰(zhàn)術(shù)動作等的特點,通過
對比
多個智能學(xué)習(xí)網(wǎng)絡(luò)模型,選擇DQN算法作為智能空戰(zhàn)的模型,同時借助飛行模擬游戲DCS,采取與游戲內(nèi)自帶敵人對戰(zhàn)的方式進行動態(tài)交互訓(xùn)練,得到能夠在一定程度上操作戰(zhàn)機作戰(zhàn)的模型與具有參考價值的空戰(zhàn)案例,通過對這些案例的分析,形成了勝/負(fù)/平局三類樣本數(shù)據(jù)集。(剩余15551字)