悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

深度學(xué)習(xí)技術(shù)在音頻自動標(biāo)注中的應(yīng)用研究

  • 打印
  • 收藏
收藏成功

摘  要:自動音頻標(biāo)注的目的是從音頻輸入生成能夠描述此音頻的一段文字。目前,音頻標(biāo)注模型的效果欠佳,并且在改善音頻標(biāo)注效果的過程中很少有應(yīng)用預(yù)加載模型。自動音頻標(biāo)注的目標(biāo)為音頻片段產(chǎn)生合適的描述語句,要能夠擁有處理音頻模態(tài)和文本模態(tài)數(shù)據(jù)的能力。為此,對音頻模態(tài)及文本模態(tài)的預(yù)加載模型進(jìn)行研究,并提出基于音頻模態(tài)的自動標(biāo)注和基于文本模態(tài)的自動標(biāo)注,解決傳統(tǒng)標(biāo)注方法中訓(xùn)練和測試階段目標(biāo)不一致的問題。(剩余5182字)

目錄
monitor