悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于PPO算法的機(jī)器人軸孔裝配控制與仿真

  • 打印
  • 收藏
收藏成功


打開(kāi)文本圖片集

摘要:針對(duì)在管道運(yùn)輸和航空航天領(lǐng)域常見(jiàn)的大口徑軸孔裝配任務(wù),設(shè)計(jì)一種基于PPO算法的裝配控制方法。首先,建立強(qiáng)化學(xué)習(xí)算法與裝配環(huán)境交互訓(xùn)練框架,設(shè)計(jì)兩個(gè)網(wǎng)絡(luò)用于擬合裝配策略和評(píng)估值函數(shù);其次,設(shè)計(jì)機(jī)器人輸出的動(dòng)作空間與裝配環(huán)境輸出的狀態(tài)空間,保證學(xué)習(xí)過(guò)程中的有效探索;然后,設(shè)計(jì)非線性獎(jiǎng)勵(lì)函數(shù)以確保訓(xùn)練過(guò)程的快速收斂;最后,搭建基于MuJoCo物理引擎的機(jī)器人大口徑軸孔裝配仿真平臺(tái),并在仿真平臺(tái)上對(duì)設(shè)計(jì)算法進(jìn)行訓(xùn)練和實(shí)驗(yàn)。(剩余9121字)

試讀結(jié)束

monitor