登录 | 注册 | 充值 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
混合的密度峰值聚类算法
  • 摘要

    密度峰值聚类(DP)算法是一种新的基于密度的聚类算法,当它处理的单个聚类包含多个密度峰值时,会将每个不同密度峰值视为潜在聚类中心,以致难以在数据集中确定正确数量聚类,为此,提出一种混合的密度峰值聚类算法C-DP.首先,以密度峰值点为初始聚类中心将数据集划分为予簇;然后,借鉴代表点层次聚类算法(CURE),从子簇中选取分散的代表点,将拥有最小距离的代表点对的类进行合并,引入参数收缩因子以控制类的形状.仿真实验结果表明,在4个合成数据集上C-DP算法比DP算法聚类效果更好;在真实数据集上的Rand Index指标对比表明,在数据集S1上,C-DP算法比DP算法性能提高了2.32%,在数据集4k2_far上,C-DP算法比DP算法性能提高了1.13%.由此可见,C-DP算法在单个类簇中包含多密度峰值的数据集中能提高聚类的准确性.

  • 作者

    王军  周凯  程勇  WANG Jun  ZHOU Kai  CHENG Yong 

  • 作者单位

    南京信息工程大学计算机与软件学院,南京210044;南京信息工程大学科技产业处,南京210044/南京信息工程大学计算机与软件学院,南京,210044/南京信息工程大学科技产业处,南京,210044

  • 刊期

    2019年2期 ISTIC PKU

  • 关键词

    密度峰值  层次聚类  类合并  代表点  收缩因子 

相似文献 查看更多>>
34.207.82.217