基于多頭注意力融合的場(chǎng)景文本識(shí)別
打開(kāi)文本圖片集
關(guān)鍵詞:計(jì)算機(jī)視覺(jué);場(chǎng)景文本識(shí)別;注意力機(jī)制;特征信息關(guān)聯(lián)
中圖分類(lèi)號(hào):TN911.73 文獻(xiàn)標(biāo)志碼:A 開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
文章編號(hào):1003-3106(2024)11-2576-09
0引言
場(chǎng)景文本識(shí)別(Scene Text Recognition,STR)在提取自然場(chǎng)景中的文本信息方面對(duì)于許多高級(jí)視覺(jué)應(yīng)用至關(guān)重要[1]。(剩余7740字)