悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

關(guān)于凸顯少數(shù)類樣本范圍的過(guò)采樣方法的研究

  • 打印
  • 收藏
收藏成功


打開(kāi)文本圖片集

摘  要:在不平衡數(shù)據(jù)集中,過(guò)采樣的主要目的是通過(guò)增加少數(shù)類樣本的數(shù)量來(lái)平衡數(shù)據(jù)集,而現(xiàn)有的過(guò)采樣方法,只考慮了少數(shù)類樣本之間的分布規(guī)律,并在少數(shù)類樣本之間進(jìn)行樣本合成,這樣會(huì)導(dǎo)致少數(shù)類樣本的范圍比實(shí)際范圍小。針對(duì)上述問(wèn)題,對(duì)凸顯少數(shù)類樣本范圍的過(guò)采樣方法進(jìn)行研究?;?種分類器(SVM、KNN、隨機(jī)森林)與5種過(guò)采樣算法(SMOTE、Borderline、KmeansSMOTE、SVMSMOTE、ADASYN)在4種不平衡數(shù)據(jù)集上開(kāi)展實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,應(yīng)用凸顯少數(shù)類樣本范圍的過(guò)采樣算法在最優(yōu)和第二優(yōu)分類結(jié)果中占最高比例,因此在數(shù)據(jù)處理中應(yīng)用該算法具有較好的效果。(剩余10523字)

目錄
monitor