基于R的文本大數(shù)據(jù)分析方法
打開文本圖片集
關(guān)鍵詞:文本大數(shù)據(jù);R語言;可視化
1引言
在大數(shù)據(jù)時(shí)代,海量文本的積累在各個(gè)領(lǐng)域不斷涌現(xiàn)。從人文研究到相關(guān)部門決策,從精準(zhǔn)醫(yī)療到量化金融,從客戶管理到市場(chǎng)營(yíng)銷,海量文本作為最重要的信息載體之一,處處發(fā)揮著舉足輕重的作用。各種語言都擁有獨(dú)特的語言模式,并時(shí)常伴隨著各式各樣的“噪音”。對(duì)這樣的文本(尤其是中文文本)進(jìn)行處理,面臨著極大的技術(shù)挑戰(zhàn)[1]。(剩余2305字)