悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于多角度融合與聯(lián)合記憶網(wǎng)絡的視頻問答認知模型

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘  要: 為了解決現(xiàn)有視頻問答模型認知推理能力不足的問題,引入旁觀者記憶模塊,提出了基于多角度融合與聯(lián)合記憶網(wǎng)絡的機器認知模型. 該模型根據(jù)問題定位目標對象,獲得視頻中對應的區(qū)域特征,同時聯(lián)合視頻的運動特征和外觀特征,通過加入時間注意力機制的門控循環(huán)單元,有效地融合問題特征和視頻特征,用(剩余21607字)

monitor