登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
一种基于数据垂直划分的分布式密度聚类算法
  • 摘要

    聚类分析是数据挖掘领域的一项重要研究课题,对大数据集的聚类更以其数据量大、噪声数据多等而成为一个难点.针对数据垂直划分的情况,提出连通点集及局部噪声点集等概念.在分析局部噪声点集与全局噪声点集以及局部连通点集与全局连通点集关系的基础上,对全局噪声点进行有效过滤,进一步设计闭三角链表结构存储各个结点的聚类中间结果,提出了基于密度的分布式聚类算法DDBSCAN.理论分析和实验结果表明,算法可以有效解决垂直划分的大数据集聚类问题,算法是有效可行的.

  • 作者

    倪巍伟  陈耿  孙志挥  Ni Weiwei  Chen Geng  Sun Zhihui 

  • 作者单位

    东南大学计算机科学与工程学院,南京,210096/南京审计学院审计信息工程实验室,南京,210029

  • 刊期

    2007年9期 ISTIC EI PKU

  • 关键词

    分布式数据挖掘  数据垂直划分  连通点集  局部噪声点集  闭三角链表 

相似文献 查看更多>>
3.234.245.125