悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于深度學(xué)習(xí)的護(hù)照文本信息識(shí)別

  • 打印
  • 收藏
收藏成功


打開(kāi)文本圖片集

摘要:應(yīng)用基于深度學(xué)習(xí)的場(chǎng)景文本檢測(cè)和場(chǎng)景文本識(shí)別的算法,實(shí)現(xiàn)對(duì)多國(guó)護(hù)照?qǐng)D片中關(guān)鍵文本信息的結(jié)構(gòu)化輸出具有重要意義。該文針對(duì)檢測(cè)算法難以處理極端長(zhǎng)寬比和小尺度文字的問(wèn)題,使用了基于像素分割的檢測(cè)方法,并且進(jìn)行多尺度特征融合獲得不同尺度的特征圖;針對(duì)字符像素受干擾的情況,使用循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像特征的上下文關(guān)系建模,以減輕污損干擾;針對(duì)無(wú)關(guān)文本干擾的情況,使用了基于文本和布局信息的多模態(tài)Transformer進(jìn)行建模,獲取關(guān)鍵信息的多模態(tài)模式,濾去無(wú)關(guān)信息,進(jìn)行關(guān)鍵詞匹配和提取,獲得了較好的實(shí)驗(yàn)結(jié)果。(剩余6357字)

目錄
monitor