悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

深度學(xué)習(xí)圖像字幕生成技術(shù)文獻(xiàn)特征研究

  • 打印
  • 收藏
收藏成功

摘 要:基于視覺的監(jiān)控已廣泛應(yīng)用于施工管理,由于施工現(xiàn)場的復(fù)雜性,施工現(xiàn)場圖元的專業(yè)性及其解釋語句的專業(yè)術(shù)語特性,導(dǎo)致基于日常生活的常規(guī)計算機(jī)視覺技術(shù)與圖像字幕方法從施工圖像中自動檢索語義信息仍具挑戰(zhàn)性。分析知名數(shù)據(jù)庫中2019年至2022年的86篇有關(guān)深度學(xué)習(xí)圖像字幕生成文獻(xiàn),結(jié)果顯示,卷積神經(jīng)網(wǎng)絡(luò)(CNN)長于解讀圖像內(nèi)容并識別其中圖像中的對象,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)或長短期記憶理論(LSTM)多用于語言生成,且CNN和LSTM組合方法優(yōu)于CNN和RNN組合方法,組合方法顯著提升運(yùn)算效率與解釋精準(zhǔn)度。(剩余6460字)

目錄
monitor