登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
基于层次划分的密度优化聚类算法
  • 摘要

    针对传统的聚类算法对数据集反复聚类,且在大型数据集上计算效率欠佳的问题,提出一种基于层次划分的最佳聚类数和初始聚类中心确定算法——基于层次划分密度的聚类优化(CODHD).该算法基于层次划分,对计算过程进行研究,不需要对数据集进行反复聚类.首先,扫描数据集获得所有聚类特征的统计值;其次,自底向上地生成不同层次的数据划分,计算每个划分数据点的密度,将最大密度点定为中心点,计算中心点距离更高密度点的最小距离,以中心点密度与最小距离乘积之和的平均值为有效性指标,增量地构建一条关于不同层次划分的聚类质量曲线;最后,根据曲线的极值点对应的划分估计最佳聚类数和初始聚类中心.实验结果表明,所提CODHD算法与预处理阶段的聚类优化(COPS)算法相比,聚类准确度提高了30%,聚类算法效率至少提高14.24%.所提算法具有较强的可行性和实用性.

  • 作者

    逄琳  刘方爱  PANG Lin  LIU Fang'ai 

  • 作者单位

    山东师范大学信息科学与工程学院,济南 250014;山东省分布式计算机软件新技术重点实验室,济南 250014

  • 刊期

    2016年6期 ISTIC PKU

  • 关键词

    聚类算法  层次划分  最佳聚类数  初始聚类中心  聚类有效性指标  clustering algorithm  hierarchical division  optimal cluster number  initial cluster center  clustering validity index 

相似文献 查看更多>>
3.234.244.18