注冊帳號丨忘記密碼?
1.點擊網(wǎng)站首頁右上角的“充值”按鈕可以為您的帳號充值
2.可選擇不同檔位的充值金額,充值后按篇按本計費
3.充值成功后即可購買網(wǎng)站上的任意文章或雜志的電子版
4.購買后文章、雜志可在個人中心的訂閱/零買找到
5.登陸后可閱讀免費專區(qū)的精彩內(nèi)容
打開文本圖片集
摘 要:計算機視覺(Computer Vision,CV)與自然語言處理(Natural Language Processing,NLP)技術(shù)已逐漸趨于成熟,結(jié)合視覺和語言的多模態(tài)領(lǐng)域技術(shù)將成為學界和業(yè)界的研究熱點。文章使用CLIP 預訓練模型,結(jié)合圖像與語言兩種模態(tài)信息,進一步將圖像拓展至視頻,利用 Fmpeg 處理視頻,并對視頻與文本信息進行嵌入(embedding)和余弦相似度匹配,從而實現(xiàn)利用純文本檢索視頻中符合該文本語義的片段。(剩余3260字)
登錄龍源期刊網(wǎng)
購買文章
基于CLIP 的多模態(tài)視頻文本檢索系統(tǒng)
文章價格:4.00元
當前余額:100.00
閱讀
您目前是文章會員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報電話:400-106-1235
舉報郵箱:[email protected]