登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
GwMKnn:针对类属性数据加权的MKnn算法①
  • 摘要

    互k近邻MKnn算法是k-近邻算法的一种有效改进算法,但其对类属性数据通常采用属性值相同为0,不同为1的方法处理,从而在类属性数据较多的数据集上分类效率受到一定程度的抑制。针对MKnn对类属性数据处理方法的不足,对类属性数据的处理引进类别基尼系数的概念,对同类样本,用基尼系数统计某一类属性中不同值分布对这个类的贡献度作为此类属性的权重,并以此作为估算不同样本之间的相似性对MKnn进行优化,扩宽MKnn的使用面。实验结果验证了该方法的有效性。

  • 作者

    陈雪云  郭躬德  陈黎飞  卢伟胜  CHEN Xue-Yun  GUO Gong-De  CHEN Li-Fei  LU Wei-Sheng 

  • 作者单位

    福建师范大学 数学与计算机科学学院,福州 350007; 龙岩学院 数学与计算机科学学院,龙岩 364012/福建师范大学 数学与计算机科学学院,福州,350007

  • 刊期

    2013年8期

  • 关键词

    类属性数据  k-近邻  互k-近邻  基尼系数  nominal data  k-nearest neighbor  mutual k-nearest neighbor  Gini index 

相似文献 查看更多>>
3.233.221.149