數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理
打開文本圖片集
摘要:該文講述的是如何從現(xiàn)有的數(shù)據(jù)中獲取新的知識(shí),但是現(xiàn)有的數(shù)據(jù)中會(huì)存在不集中、雜亂,甚至還不完整數(shù)據(jù)。雖然使用數(shù)據(jù)挖掘機(jī)模型進(jìn)行微調(diào)和開發(fā)還會(huì)出現(xiàn)一些雜音,但仍然可以從中獲取到有用的數(shù)據(jù),保證數(shù)據(jù)的質(zhì)量。主要數(shù)據(jù)挖掘流程:獲取數(shù)據(jù)、清洗數(shù)據(jù)、探索數(shù)據(jù)、建模數(shù)據(jù)、轉(zhuǎn)換數(shù)據(jù)。
關(guān)鍵詞:數(shù)據(jù)挖掘;數(shù)據(jù)預(yù)處理;獲取數(shù)據(jù);清洗數(shù)據(jù);探索數(shù)據(jù);建模數(shù)據(jù)
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2022)04-0027-02
1 數(shù)據(jù)挖掘
1.1數(shù)據(jù)挖掘模型的介紹
數(shù)據(jù)挖掘是獲取知識(shí)的經(jīng)過,數(shù)據(jù)挖掘模型是從種種數(shù)據(jù)源來獲取所需要的數(shù)據(jù),然后再將這些數(shù)據(jù)轉(zhuǎn)換成知識(shí),把這些知識(shí)再提供給所需要的區(qū)域。(剩余3499字)