面向新浪微博的Top-N突發(fā)事件檢測方法
摘要:文章面向微博數(shù)據(jù),搭建了Top-N突發(fā)事件檢測的系統(tǒng)框架,包括博文采集與預(yù)處理、突發(fā)詞檢測、突發(fā)詞聚類、突發(fā)事件排序等部分。實驗結(jié)果表明,文中所提方法改善了現(xiàn)有突發(fā)事件檢測方法的不足,在Top-N突發(fā)事件檢測中效果較好。
關(guān)鍵詞:突發(fā)事件;突發(fā)詞檢測;突發(fā)詞聚類
中圖分類號: TP391 文獻標(biāo)識碼:A
文章編號:1009-3044(2023)30-0102-02
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID)
0 引言
新媒體背景下,以微博、新聞客戶端、微信等為代表的移動社交網(wǎng)絡(luò)平臺興起,地域不再是限制突發(fā)事件影響力的因素,事件一旦爆發(fā),其影響的深度、廣度會急劇擴大,對國家安全和社會安定造成威脅[1]。(剩余3671字)