注冊帳號丨忘記密碼?
1.點擊網(wǎng)站首頁右上角的“充值”按鈕可以為您的帳號充值
2.可選擇不同檔位的充值金額,充值后按篇按本計費(fèi)
3.充值成功后即可購買網(wǎng)站上的任意文章或雜志的電子版
4.購買后文章、雜志可在個人中心的訂閱/零買找到
5.登陸后可閱讀免費(fèi)專區(qū)的精彩內(nèi)容
打開文本圖片集
摘要:使用強(qiáng)化學(xué)習(xí)解決機(jī)器人操作問題有著諸多優(yōu)勢,然而傳統(tǒng)的強(qiáng)化學(xué)習(xí)算法面臨著獎勵稀疏的困難,且得到的策略難以直接應(yīng)用到現(xiàn)實環(huán)境中。為了提高策略從仿真到現(xiàn)實遷移的成功率,提出了基于目標(biāo)的域隨機(jī)化方法。使用基于目標(biāo)的強(qiáng)化學(xué)習(xí)算法對模型進(jìn)行訓(xùn)練,可以有效地應(yīng)對機(jī)器人操作任務(wù)獎勵稀疏的情況,得到的策略可以在仿真環(huán)境下良好運(yùn)行。(剩余15860字)
登錄龍源期刊網(wǎng)
購買文章
基于目標(biāo)的域隨機(jī)化方法在機(jī)器人操作方面的研究
文章價格:6.00元
當(dāng)前余額:100.00
閱讀
您目前是文章會員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報電話:400-106-1235
舉報郵箱:[email protected]