登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
K-means算法最佳聚类数确定方法
  • 摘要

    K-means聚类算法是以确定的类数k为前提对数据集进行聚类的,通常聚类数事先无法确定.从样本几何结构的角度设计了一种新的聚类有效性指标,在此基础上提出了一种新的确定K-means算法最佳聚类数的方法.理论研究和实验结果验证了以上算法方案的有效性和良好性能.

  • 作者

    周世兵  徐振源  唐旭清  ZHOU Shi-bing  XU Zhen-yuan  TANG Xu-qing 

  • 作者单位

    江南大学,信息工程学院,江苏,无锡,214122/江南大学,信息工程学院,江苏,无锡,214122;江南大学,理学院,江苏,无锡,214122/江南大学,理学院,江苏,无锡,214122

  • 刊期

    2010年8期 ISTIC PKU

  • 关键词

    K-means 聚类  聚类数  聚类有效性指标  聚类分析 

参考文献
  • [1] 孙吉贵,刘杰,赵连宇. 聚类算法研究. 软件学报, 2008,1
  • [2] Dembele D;Kastner P. Fuzzy C-means method for clustering microarray data.. Bioinformatics, 2003,8
  • [3] CALINSKI R;HARABASZ J. A dendrite method for cluster analysis. Communications in Statistics, 1974,01
  • [4] DAVIES D L;BOULDIN D W. A cluster separation measure. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1979,02
  • [5] DUDOIT S;FRIDLYAND J. A prediction-based resampling method for estimating the number of clusters in a dataset. Genome Biology, 2002,07
  • [6] DIMITRIADOU E;DOLNICAR S;WEINGESSEL A. An examination of indexes for determining the number of cluster in binary data sets. Psychometrika, 2002,01
  • [7] KAPP A V;TIBSHIRANI R. Are clusters found in one dataset present in another dataset. BIOSTATISTICS, 2007,01
  • [8] 孙即祥. 现代模式识别. 长沙:国防科技大学出版社, 2002
  • [9] ROUSSEEUW P J. Silhouettes:a graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics, 1987,01
查看更多︾
相似文献 查看更多>>
3.234.245.125