悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于PPO算法的自動駕駛?cè)藱C交互式強化學(xué)習(xí)方法

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘 要:針對當(dāng)前自動駕駛領(lǐng)域中深度強化學(xué)習(xí)(deep reinforcement learning,DRL)所面臨的高計算性能需求和收斂速度慢的問題,將變分自編碼器(variational autoencoder,VAE)和近端策略優(yōu)化算法(proximal policy optimization,PPO)相結(jié)合。(剩余10261字)

目錄
monitor