悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于特征聚合的管制語(yǔ)音聲紋深度識(shí)別方法

  • 打印
  • 收藏
收藏成功


打開(kāi)文本圖片集

摘 要: 針對(duì)帶有噪聲的管制語(yǔ)音聲紋識(shí)別問(wèn)題,提出了一種基于特征聚合的聲紋識(shí)別算法,能夠在音頻流中識(shí)別不同的管制員和飛行員的聲紋特征。在經(jīng)典的X-VECTORS算法的基礎(chǔ)上,通過(guò)設(shè)計(jì)殘差語(yǔ)譜圖特征提取模塊和全局可微的NetVLAD特征聚合模塊,構(gòu)造了端到端的說(shuō)話人識(shí)別神經(jīng)網(wǎng)絡(luò)訓(xùn)練框架;最后在實(shí)際管制語(yǔ)音數(shù)據(jù)集上對(duì)各種說(shuō)話人識(shí)別方法的精度進(jìn)行了對(duì)比分析。(剩余8471字)

目錄
monitor