悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于改進(jìn)好奇心的深度強(qiáng)化學(xué)習(xí)方法

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘 要:

在深度強(qiáng)化學(xué)習(xí)方法中,針對內(nèi)在好奇心模塊(intrinsic curiosity model,ICM)指導(dǎo)智能體在稀疏獎(jiǎng)勵(lì)環(huán)境中獲得未知策略學(xué)習(xí)的機(jī)會,但好奇心獎(jiǎng)勵(lì)是一個(gè)狀態(tài)差異值,會使智能體過度關(guān)注于對新狀態(tài)的探索,進(jìn)而出現(xiàn)盲目探索的問題,提出了一種基于知識蒸餾的內(nèi)在好奇心改進(jìn)算法(intrinsic curiosity model algorithm based on knowledge distillation,KD-ICM)。(剩余11426字)

目錄
monitor