悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于目標(biāo)的域隨機(jī)化方法在機(jī)器人操作方面的研究

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘要:使用強(qiáng)化學(xué)習(xí)解決機(jī)器人操作問題有著諸多優(yōu)勢,然而傳統(tǒng)的強(qiáng)化學(xué)習(xí)算法面臨著獎勵稀疏的困難,且得到的策略難以直接應(yīng)用到現(xiàn)實環(huán)境中。為了提高策略從仿真到現(xiàn)實遷移的成功率,提出了基于目標(biāo)的域隨機(jī)化方法。使用基于目標(biāo)的強(qiáng)化學(xué)習(xí)算法對模型進(jìn)行訓(xùn)練,可以有效地應(yīng)對機(jī)器人操作任務(wù)獎勵稀疏的情況,得到的策略可以在仿真環(huán)境下良好運(yùn)行。(剩余15860字)

目錄
monitor