注冊帳號丨忘記密碼?
1.點擊網(wǎng)站首頁右上角的“充值”按鈕可以為您的帳號充值
2.可選擇不同檔位的充值金額,充值后按篇按本計費
3.充值成功后即可購買網(wǎng)站上的任意文章或雜志的電子版
4.購買后文章、雜志可在個人中心的訂閱/零買找到
5.登陸后可閱讀免費專區(qū)的精彩內(nèi)容
打開文本圖片集
摘 要:針對多模態(tài)模型中基于視覺區(qū)域特征提取方法表征能力有限的問題,文章提出了一種基于圖像情景文本融合的多模態(tài)特征提取方法,并構(gòu)建了圖像情景文本融合的視覺語言多模態(tài)網(wǎng)絡(luò)模型,簡稱OCR-ViLT,通過引入預(yù)訓(xùn)練加微調(diào)的遷移學(xué)習(xí)方案,降低模型訓(xùn)練成本。并經(jīng)過大量實驗探究模型的輸入策略,文章建議,在跨模態(tài)檢索任務(wù)中,采取圖文比例2:3能夠獲得最優(yōu)的召回率。(剩余6656字)
登錄龍源期刊網(wǎng)
購買文章
圖像情景文本融合的多模態(tài)模型性能策略研究
文章價格:5.00元
當(dāng)前余額:100.00
閱讀
您目前是文章會員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報電話:400-106-1235
舉報郵箱:[email protected]