深度學(xué)習(xí)圖像字幕應(yīng)用于施工現(xiàn)場視覺管理研究
打開文本圖片集
摘 要:由于施工現(xiàn)場的復(fù)雜性,從現(xiàn)場圖像中檢索施工對象、施工活動(dòng)及其交互活動(dòng)關(guān)系具有挑戰(zhàn)性。對比深度學(xué)習(xí)圖像字幕生成幾種方法精準(zhǔn)度,結(jié)果表明,深度學(xué)習(xí)圖像字幕技術(shù)用于施工現(xiàn)場圖像中生成精確文本描述是可行的,其在施工場景分析等領(lǐng)域有廣闊應(yīng)用前景。
關(guān)鍵詞:深度學(xué)習(xí);圖像字幕;施工機(jī)械;視覺監(jiān)控
施工現(xiàn)場視頻包含工程項(xiàng)目管理所需的施工設(shè)備、施工對象及其活動(dòng)關(guān)系等重要的視覺信息。(剩余4668字)