基于過(guò)濾冗余信息相似性的電影推薦算法
打開文本圖片集
關(guān)鍵詞:推薦系統(tǒng);內(nèi)容相似性;過(guò)濾冗余信息;LZ77算法;哈夫曼編碼
中圖分類號(hào):TP391.4 文獻(xiàn)標(biāo)志碼:A
0 引言(Introduction)
在基于內(nèi)容相似性的方法中,文本相似性具有重要意義[1]。文本相似性是指兩個(gè)文本之間的語(yǔ)義相似程度,它是自然語(yǔ)言處理領(lǐng)域中的一個(gè)基本問(wèn)題,其研究領(lǐng)域廣泛,涵蓋多個(gè)方面,主要包括基于詞袋模型的算法[2]、基于詞匯的算法[3]及基于深度學(xué)習(xí)的算法[4]等。(剩余6579字)