注冊帳號丨忘記密碼?
1.點(diǎn)擊網(wǎng)站首頁右上角的“充值”按鈕可以為您的帳號充值
2.可選擇不同檔位的充值金額,充值后按篇按本計(jì)費(fèi)
3.充值成功后即可購買網(wǎng)站上的任意文章或雜志的電子版
4.購買后文章、雜志可在個(gè)人中心的訂閱/零買找到
5.登陸后可閱讀免費(fèi)專區(qū)的精彩內(nèi)容
打開文本圖片集
摘 要:
在深度強(qiáng)化學(xué)習(xí)方法中,針對內(nèi)在好奇心模塊(intrinsic curiosity model,ICM)指導(dǎo)智能體在稀疏獎(jiǎng)勵(lì)環(huán)境中獲得未知策略學(xué)習(xí)的機(jī)會,但好奇心獎(jiǎng)勵(lì)是一個(gè)狀態(tài)差異值,會使智能體過度關(guān)注于對新狀態(tài)的探索,進(jìn)而出現(xiàn)盲目探索的問題,提出了一種基于知識蒸餾的內(nèi)在好奇心改進(jìn)算法(intrinsic curiosity model algorithm based on knowledge distillation,KD-ICM)。(剩余11426字)
登錄龍?jiān)雌诳W(wǎng)
購買文章
基于改進(jìn)好奇心的深度強(qiáng)化學(xué)習(xí)方法
文章價(jià)格:6.00元
當(dāng)前余額:100.00
閱讀
您目前是文章會員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報(bào)電話:400-106-1235
舉報(bào)郵箱:[email protected]