悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于雙語(yǔ)詞典的遠(yuǎn)距離語(yǔ)對(duì)無監(jiān)督神經(jīng)機(jī)器翻譯方法

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘  要: 為了緩解大型平行語(yǔ)料庫(kù)稀缺性對(duì)機(jī)器翻譯質(zhì)量的影響,無監(jiān)督方法在神經(jīng)機(jī)器翻譯領(lǐng)域備受關(guān)注,但其在遠(yuǎn)距離語(yǔ)言對(duì)上的翻譯表現(xiàn)仍有待提高。因此,文中引入了翻譯語(yǔ)言模型(TLM)并提出了Dict?TLM方法。該方法的核心思想是結(jié)合單語(yǔ)語(yǔ)料和無監(jiān)督雙語(yǔ)詞典訓(xùn)練語(yǔ)言模型。具體而言,模型首先接受源語(yǔ)言句子作為輸入,然后,不同于傳統(tǒng)TLM只接受平行語(yǔ)料,Dict?TLM模型還接受源語(yǔ)言句子通過無監(jiān)督雙語(yǔ)詞典處理后的數(shù)據(jù)作為輸入,在這種輸入中,模型將源語(yǔ)言句子中在雙語(yǔ)詞典中出現(xiàn)的單詞替換為相應(yīng)的目標(biāo)語(yǔ)言翻譯詞,重要的是,該方法中的雙語(yǔ)詞典是無監(jiān)督獲得的。(剩余10344字)

目錄
monitor