登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
基于划分的聚类个数与初始中心的确定方法
  • 摘要

    k均值聚类算法在对数据进行聚类时需要以确定的聚类个数和初始聚类中心为前提,但聚类个数是难以准确给定的,通常随机选取k个样本作为初始聚类中心,由于不同的初始聚类中心可能导致不同的聚类结果,采用随机选取初始聚类中心的方法存在着较大的盲目性,造成聚类结果极不稳定.为此,提出了一种基于划分的聚类个数与初始中心点的确定方法.该方法通过对数据空间进行划分,统计每个网格空间中数据点数目作为网格的数据密度,同时计算局部密度极大值的网格个数;按照不同的分度值对数据集进行划分,当局部密度极大值的网格个数趋于相对稳定时,将局部密度极大值的网格个数作为聚类个数,并同时获得聚类初始中心.基于机器学习数据库数据集以及随机生成的人工模拟数据集进行了仿真实验,实验结果表明,所提出的算法有效可行,具有较高的准确性.

  • 作者

    征原  谢云  ZHENG Yuan  XIE Yun 

  • 作者单位

    南京邮电大学 江苏省无线通信重点实验室,江苏 南京,210003

  • 刊期

    2017年7期 ISTIC

  • 关键词

    k均值聚类  聚类个数  初始聚类中心  划分  k-means clustering  number of clustering  initial clustering centers  partitioning 

相似文献 查看更多>>
18.232.188.251