悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

概率預(yù)測強(qiáng)化學(xué)習(xí)下非結(jié)構(gòu)環(huán)境機(jī)械臂變阻抗力跟蹤控制

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘要: 針對非結(jié)構(gòu)環(huán)境下末端實(shí)時(shí)移動機(jī)械臂阻抗控制力跟蹤問題,通過動態(tài)調(diào)節(jié)阻尼系數(shù)以應(yīng)對接觸環(huán)境的不確定性。為確保阻抗策略的高效搜索,利用機(jī)械臂與接觸環(huán)境交互產(chǎn)生狀態(tài)-動作序列構(gòu)建概率預(yù)測模型(PPM)。學(xué)習(xí)過程中,機(jī)械臂僅需與非結(jié)構(gòu)接觸環(huán)境進(jìn)行少量交互即可獲得最優(yōu)變阻抗策略,這使得該過程在真實(shí)機(jī)械臂上直接訓(xùn)練成為可能。(剩余14707字)

monitor