悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于深度強化學(xué)習(xí)的對話系統(tǒng)研究

  • 打印
  • 收藏
收藏成功


打開文本圖片集

一、引言

隨著人工智能技術(shù)的快速發(fā)展,對話系統(tǒng)在人機交互、智能助理和客戶服務(wù)等領(lǐng)域嶄露頭角,成為促進人機溝通的關(guān)鍵技術(shù)之一。對話系統(tǒng)場景可以建模成為馬爾可夫決策過程(Markov Decision Process,MDP),而強化學(xué)習(xí)也是在馬爾可夫決策過程基礎(chǔ)上發(fā)展起來的,所以利用強化學(xué)習(xí)解決對話系統(tǒng)場景有著天然的優(yōu)勢。(剩余3082字)

目錄
monitor