悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

特別提示

1.點擊網(wǎng)站首頁右上角的“充值”按鈕可以為您的帳號充值

2.可選擇不同檔位的充值金額，充值后按篇按本計費

3.充值成功后即可購買網(wǎng)站上的任意文章或雜志的電子版

4.購買后文章、雜志可在個人中心的訂閱/零買找到

5.登陸后可閱讀免費專區(qū)的精彩內(nèi)容

基于PPO算法的自動駕駛?cè)藱C交互式強化學(xué)習(xí)方法

打印
收藏

收藏成功

微博 QQ空間微信

打開文本圖片集

摘要：針對當(dāng)前自動駕駛領(lǐng)域中深度強化學(xué)習(xí)（deep reinforcement learning，DRL）所面臨的高計算性能需求和收斂速度慢的問題，將變分自編碼器（variational autoencoder，VAE）和近端策略優(yōu)化算法（proximal policy optimization，PPO）相結(jié)合。（剩余10261字）

試讀結(jié)束

購買全文6.00元下一篇基于魚群涌現(xiàn)行為啟發(fā)的集群機器人硬注意力強化模型

計算機應(yīng)用研究

2024年09期

￥12.00/本