悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于高斯混合模型的分布式強化學習算法魯棒性優(yōu)化

  • 打印
  • 收藏
收藏成功

摘 要:當前,分布式強化學習假設所有智能體均能正常工作,但在實際情況中可能存在異常智能體。為此,提出了一種基于高斯混合模型的聚類方法,用于優(yōu)化分布式強化學習算法。首先,計算智能體上傳梯度對應的高斯分布概率。其次,根據(jù)高斯分布更新聚類模型參數(shù),并重復執(zhí)行上述步驟直至收斂。最后,根據(jù)聚類模型篩選異常梯度。(剩余6969字)

試讀結束

monitor