悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

異步策略的強化因果發(fā)現(xiàn)方法

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘要:研究和發(fā)掘事物之間的因果關(guān)系是數(shù)據(jù)科學(xué)的核心問題之一。針對因果發(fā)現(xiàn)面臨著搜索空間超指數(shù)量級增長、評價指標低、收斂速度慢且效果差等問題,本文提出一種基于異步策略的強化因果發(fā)現(xiàn)方法。首先采用自注意力機制的編碼器和單層解碼器模型探索數(shù)據(jù)之間的因果關(guān)系;其次,改進強化學(xué)習模型中的結(jié)構(gòu)約束,并基于異步優(yōu)勢算法更新網(wǎng)絡(luò)模型參數(shù);最后,搜索、輸出最大獎勵的有向無環(huán)圖。(剩余23837字)

monitor