悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于深度強(qiáng)化學(xué)習(xí)的圖書分揀車的路徑規(guī)劃

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘  要: 針對(duì)圖書智能分揀系統(tǒng)中的分揀車路徑規(guī)劃問題,提出一種基于深度強(qiáng)化學(xué)習(xí)框架和競(jìng)爭(zhēng)雙深度Q網(wǎng)絡(luò)路徑規(guī)劃算法。將分揀車的路徑規(guī)劃問題構(gòu)建成馬爾可夫決策過程,然后通過結(jié)合競(jìng)爭(zhēng)Q網(wǎng)絡(luò)和雙深度Q網(wǎng)絡(luò)構(gòu)建競(jìng)爭(zhēng)雙深度Q網(wǎng)絡(luò)(D3QN),進(jìn)而在避免過估計(jì)的同時(shí),優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)。最后,通過設(shè)計(jì)智能代理的狀態(tài)、動(dòng)作和獎(jiǎng)勵(lì)函數(shù),并采用動(dòng)態(tài)[ε?]貪婪算法和衰減式學(xué)習(xí)率策略,使智能代理能夠快速地選擇最優(yōu)動(dòng)作,縮短完成預(yù)定卸載的移動(dòng)路徑,降低碰撞障礙物的概率。(剩余12544字)

monitor