悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于組稀疏優(yōu)化的強(qiáng)化學(xué)習(xí)稀疏表征

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘要:強(qiáng)化學(xué)習(xí)由于具有出色的數(shù)據(jù)效率和快速學(xué)習(xí)的能力,開始應(yīng)用于許多實(shí)際問(wèn)題以學(xué)習(xí)復(fù)雜策略。但是高維環(huán)境中的強(qiáng)化學(xué)習(xí)常常受限于維度災(zāi)難或者災(zāi)難性干擾,性能表現(xiàn)不佳甚至導(dǎo)致學(xué)習(xí)失敗。圍繞表征學(xué)習(xí),提出了一種符合Lasso 類型優(yōu)化的稀疏卷積深度強(qiáng)化學(xué)習(xí)方法。首先,對(duì)稀疏表征的理論和優(yōu)勢(shì)進(jìn)行綜述,將稀疏卷積方法引入深度強(qiáng)化學(xué)習(xí)中,提出了一種新的稀疏表征方法;其次,對(duì)由稀疏卷積編碼定義的可微優(yōu)化層進(jìn)行了數(shù)學(xué)推導(dǎo)并給出了優(yōu)化算法,為了驗(yàn)證新的稀疏表征方法的有效性,將其應(yīng)用于相關(guān)文獻(xiàn)常見的基準(zhǔn)環(huán)境中進(jìn)行測(cè)試。(剩余8514字)

monitor