注冊(cè)帳號(hào)丨忘記密碼?
1.點(diǎn)擊網(wǎng)站首頁(yè)右上角的“充值”按鈕可以為您的帳號(hào)充值
2.可選擇不同檔位的充值金額,充值后按篇按本計(jì)費(fèi)
3.充值成功后即可購(gòu)買(mǎi)網(wǎng)站上的任意文章或雜志的電子版
4.購(gòu)買(mǎi)后文章、雜志可在個(gè)人中心的訂閱/零買(mǎi)找到
5.登陸后可閱讀免費(fèi)專(zhuān)區(qū)的精彩內(nèi)容
打開(kāi)文本圖片集
摘 要:圖像描述是指為圖像自動(dòng)生成與其內(nèi)容相符的語(yǔ)言描述。橋接計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理兩個(gè)領(lǐng)域的預(yù)訓(xùn)練模型構(gòu)建圖像描述模型時(shí),跨模態(tài)語(yǔ)義一致性是共享子空間嵌入的核心問(wèn)題。本文將圖像拆分成若干片作為視覺(jué)語(yǔ)義單元與語(yǔ)言特征進(jìn)行自由的跨模態(tài)關(guān)聯(lián),突破了有限視覺(jué)特征分類(lèi)的限制;聯(lián)合運(yùn)用掩碼學(xué)習(xí)和圖文特征匹配兩個(gè)損失函數(shù),挑選高難度負(fù)樣本訓(xùn)練跨模態(tài)跳接網(wǎng)絡(luò)提取一致性全局語(yǔ)義,提高了子空間鄰域內(nèi)高相似度圖文特征點(diǎn)匹配的準(zhǔn)確度。(剩余17488字)
登錄龍?jiān)雌诳W(wǎng)
購(gòu)買(mǎi)文章
融合全局語(yǔ)義的CLIP-GPT圖像描述模型
文章價(jià)格:6.00元
當(dāng)前余額:100.00
閱讀
您目前是文章會(huì)員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報(bào)電話(huà):400-106-1235
舉報(bào)郵箱:[email protected]