基于DBSCAN改進的SMOTE算法
打開文本圖片集
摘要:針對傳統(tǒng)的合成少數(shù)類過采樣技術(Synthetic Minority Oversampling Technique,SMOTE)中存在的忽略類間不平衡、類內(nèi)不平衡、無法控制合成樣本的噪聲等問題,結合DBSCAN聚類算法,提出了一種基于DBSCAN改進的SMOTE算法:使用DBSCAN算法對少數(shù)類樣本進行聚類,計算少數(shù)類密度系數(shù)和采用權重為每個簇分配采樣數(shù)量,將每個簇中樣本點按照到簇質心的距離分為2類,對每類中的樣本點分配不同的隨機系數(shù)進行過采樣,得到新的較為平衡的數(shù)據(jù)集。(剩余6976字)