悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于BERT模型的網(wǎng)站敏感信息識別及其變體還原技術(shù)研究

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘  要: 針對各類網(wǎng)站為了避免被檢測到敏感信息,網(wǎng)站內(nèi)的文字常采用變體詞對敏感詞詞庫進行規(guī)避。為解決這一問題,文中提出一種基于BERT模型結(jié)合變體字還原算法的網(wǎng)站敏感信息識別的方法。該方法將針對文本中的變體詞進行還原,通過采用BERT模型對文本內(nèi)容進行向量化,并將其輸入由BiLSTM層和CNN層構(gòu)成的模型進行訓(xùn)練,從而實現(xiàn)對網(wǎng)站內(nèi)敏感信息及其變體詞的識別。(剩余14065字)

monitor