悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于強(qiáng)化學(xué)習(xí)的多目標(biāo)點(diǎn)航關(guān)聯(lián)方法

  • 打印
  • 收藏
收藏成功


打開(kāi)文本圖片集

摘 要:針對(duì)密集雜波環(huán)境下的多目標(biāo)點(diǎn)跡-航跡關(guān)聯(lián)問(wèn)題,以強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)方法為基礎(chǔ),提出了一種基于Q學(xué)習(xí)的多目標(biāo)點(diǎn)跡-航跡關(guān)聯(lián)方法。首先,根據(jù)整個(gè)過(guò)程中目標(biāo)的運(yùn)動(dòng)狀態(tài),建立馬爾可夫決策過(guò)程(Markov Decision Process, MDP)模型。(剩余11421字)

目錄
monitor