注冊(cè)帳號(hào)丨忘記密碼?
1.點(diǎn)擊網(wǎng)站首頁右上角的“充值”按鈕可以為您的帳號(hào)充值
2.可選擇不同檔位的充值金額,充值后按篇按本計(jì)費(fèi)
3.充值成功后即可購買網(wǎng)站上的任意文章或雜志的電子版
4.購買后文章、雜志可在個(gè)人中心的訂閱/零買找到
5.登陸后可閱讀免費(fèi)專區(qū)的精彩內(nèi)容
打開文本圖片集
摘要:新詞的有效識(shí)別是文本預(yù)處理過程中一項(xiàng)非常重要的任務(wù),關(guān)系到分詞效果的好壞。針對(duì)傳統(tǒng)新詞發(fā)現(xiàn)方法未考慮單字新詞的識(shí)別,且忽略了上下文句法結(jié)構(gòu)與語義信息對(duì)新詞識(shí)別結(jié)果的影響,提出一種統(tǒng)計(jì)量計(jì)算結(jié)合相似性判斷的網(wǎng)絡(luò)新詞發(fā)現(xiàn)算法。首先,基于字的粒度,依次計(jì)算單字詞頻、最大增強(qiáng)互信息和加權(quán)左右鄰接熵,從左向右逐字?jǐn)U展多字詞,獲得具有高成詞概率的候選新詞集合;再利用基于句法與語義的改進(jìn)相似性計(jì)算模型,得到語句相似度,過濾無效新詞。(剩余13782字)
登錄龍?jiān)雌诳W(wǎng)
購買文章
融合相似性判斷的網(wǎng)絡(luò)新詞發(fā)現(xiàn)算法
文章價(jià)格:6.00元
當(dāng)前余額:100.00
閱讀
您目前是文章會(huì)員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報(bào)電話:400-106-1235
舉報(bào)郵箱:[email protected]