悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于互信息解決多標(biāo)簽文本分類中的長尾問題

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘 要:

針對當(dāng)前解決多標(biāo)簽文本分類中長尾問題的方法多以破壞原本數(shù)據(jù)分布為代價(jià),在真實(shí)數(shù)據(jù)上的泛化性能下降,無法有效地緩解樣本的長尾分布的問題,提出了基于互信息解決長尾問題的多標(biāo)簽文本分類方法(MLTC-LD)。首先,創(chuàng)建關(guān)于標(biāo)簽樣本的關(guān)系矩陣,計(jì)算標(biāo)簽樣本間的依賴關(guān)系;其次,考慮標(biāo)簽樣本間關(guān)系程度的強(qiáng)弱構(gòu)造鄰居選擇器,將擁有強(qiáng)關(guān)系的鄰居信息作為主要語義特征并作為先驗(yàn)信息;最后,通過圖注意力神經(jīng)網(wǎng)絡(luò)將先驗(yàn)信息引入分類器,實(shí)現(xiàn)了借助分布頭部數(shù)據(jù)豐富類的知識來提高尾部數(shù)據(jù)貧乏類的性能的目標(biāo)。(剩余14620字)

目錄
monitor