注冊帳號丨忘記密碼?
1.點擊網(wǎng)站首頁右上角的“充值”按鈕可以為您的帳號充值
2.可選擇不同檔位的充值金額,充值后按篇按本計費
3.充值成功后即可購買網(wǎng)站上的任意文章或雜志的電子版
4.購買后文章、雜志可在個人中心的訂閱/零買找到
5.登陸后可閱讀免費專區(qū)的精彩內(nèi)容
打開文本圖片集
一、引言
隨著人工智能技術(shù)的快速發(fā)展,對話系統(tǒng)在人機交互、智能助理和客戶服務(wù)等領(lǐng)域嶄露頭角,成為促進人機溝通的關(guān)鍵技術(shù)之一。對話系統(tǒng)場景可以建模成為馬爾可夫決策過程(Markov Decision Process,MDP),而強化學(xué)習(xí)也是在馬爾可夫決策過程基礎(chǔ)上發(fā)展起來的,所以利用強化學(xué)習(xí)解決對話系統(tǒng)場景有著天然的優(yōu)勢。(剩余3082字)
登錄龍源期刊網(wǎng)
購買文章
基于深度強化學(xué)習(xí)的對話系統(tǒng)研究
文章價格:4.00元
當(dāng)前余額:100.00
閱讀
您目前是文章會員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報電話:400-106-1235
舉報郵箱:[email protected]