基于目標(biāo)的域隨機(jī)化方法在機(jī)器人操作方面的研究

打印
收藏

收藏成功

微博 QQ空間微信

打開文本圖片集

摘要：使用強(qiáng)化學(xué)習(xí)解決機(jī)器人操作問題有著諸多優(yōu)勢，然而傳統(tǒng)的強(qiáng)化學(xué)習(xí)算法面臨著獎勵稀疏的困難，且得到的策略難以直接應(yīng)用到現(xiàn)實環(huán)境中。為了提高策略從仿真到現(xiàn)實遷移的成功率，提出了基于目標(biāo)的域隨機(jī)化方法。使用基于目標(biāo)的強(qiáng)化學(xué)習(xí)算法對模型進(jìn)行訓(xùn)練，可以有效地應(yīng)對機(jī)器人操作任務(wù)獎勵稀疏的情況，得到的策略可以在仿真環(huán)境下良好運(yùn)行。（剩余15860字）

試讀結(jié)束

購買全文6.00元下一篇考慮零件功能性削減的多目標(biāo)拆卸方案決策

計算機(jī)應(yīng)用研究

2022年10期

￥12.00/本

悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于目標(biāo)的域隨機(jī)化方法在機(jī)器人操作方面的研究