登录 | 注册 | 充值 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
DEN-Stream:一种分布式数据流聚类方法
  • 摘要

    现有的数据流聚类方法很难兼顾数据稀疏和子空间聚类等高维数据难题,而分布式数据流对数据流聚类提出包括在线计算效率、通信开销以及多路数据的融合等更多挑战.提出分布式数据流聚类方法,采用全局统一的网格划分和衰退时间以支持多路数据流融合,并周期性检查和删除过期网格来控制概要规模.通过对多路高维数据流的一遍扫描,发现高维数据流子空间任意形状的聚类,并反映数据分布随时间的演化.在线组件效率高开销低,概要信息简洁,通信代价低.实验表明,该方法能够对分布式数据流正确聚类并演进,在线组件效率高,概要规模小.

  • 作者

    李长路  王劲林  郭志川  韩锐  Li Changlu  Wang Jinlin  Guo Zhichuan  Han Rui 

  • 作者单位

    中国科学院大学 北京100190;中国科学院声学研究所国家网络新媒体工程技术研究中心 北京100190/中国科学院声学研究所国家网络新媒体工程技术研究中心 北京100190

  • 刊期

    2016年7期 ISTIC PKU

  • 关键词

    分布式数据流  子空间聚类  网格聚类  高维数据  Distributed data stream  Subspace clustering  Grid-based clustering  High-dimensional data 

相似文献 查看更多>>
100.24.122.228