悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

NEMTF:基于多維度文本特征的新聞網(wǎng)頁信息提取方法

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘要:目前主流的網(wǎng)頁抽取方法存在兩大問題:提取信息類型單一,難以獲取多種類新聞信息;多依賴HTML標(biāo)簽,難以擴展至不同來源。為此提出一種基于多維度文本特征的新聞網(wǎng)頁信息提取方法,利用新聞文本的寫作特點劃分出寫作、語義和位置特征,通過多通道卷積神經(jīng)網(wǎng)絡(luò)融合為多維度文本特征,用于提取多種類新聞網(wǎng)頁信息;僅需少量數(shù)據(jù)集訓(xùn)練,就可提取新來源的新聞網(wǎng)頁信息。(剩余16544字)

目錄
monitor