悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

動態(tài)多視圖推理分層相似性的圖文檢索算法

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘 要:跨模態(tài)圖像文本檢索通常指的是可見光圖像和正常文本。其中,基于標(biāo)量的圖文相似度具有局限性,無法全面表示跨模態(tài)對齊。同時,局部區(qū)域—單詞相關(guān)性和全局圖像—文本依賴性之間存在復(fù)雜的相互作用,所以用于推理兩種模態(tài)特征的模塊存在一定程度的不確定性。針對上述問題,文章提出了一種基于層次相似網(wǎng)絡(luò)的圖文匹配動態(tài)多視圖推理方法。(剩余11348字)

目錄
monitor