登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
一种更有效的K-means聚类算法
  • 摘要

    一个好的聚类算法不仅要考虑"同类内尽可能的相似,不同类间尽可能的相异",而且也要考虑算法的时间复杂度.针对K-means算法依赖于初始聚类中心而影响聚类结果,提出了一种基于样本分布选取初始聚类中心的方法;针对K-means算法中每次调整聚类中心后指定聚类所需要的大量的距离计算,提出了三角不等式原理避免冗余计算的方法.将两种方法结合进行实验,结果表明新的方法更加有效,不仅较原算法有良好的聚类划分,而且加快了原算法的运行速度.

  • 作者

    单玉双  邢长征 

  • 作者单位

    辽宁工程技术大学电子与信息工程学院,辽宁,葫芦岛,125105

  • 刊期

    2009年8期

  • 关键词

    聚类算法  时间复杂度  样本分布  冗余计算  聚类划分 

参考文献
  • [1] 陈晓云,王平,何春霞,冷明伟. 基于三角不等式原理的TTSAS聚类加速算法. 计算机工程, 2006,17
  • [2] 朱明. 数据挖掘. 合肥:中国科学技术大学出版社, 2002
  • [3] 谭斯坦巴赫;范明;范宏建. 数据挖掘导论. 北京:人民邮电出版社, 2006
  • [4] 唐立新;王梦光. 用遗传算法改进聚类分析中的k平均算法. 数理统计与应用概率, 1997,04
  • [5] 李听;郑宇;江芳泽. 用改进RPCL算法提取聚类的最佳数目. 上海大学学报(自然科学版), 1999,05
相似文献 查看更多>>
3.95.139.100