登录 | 注册 | 充值 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
基于邻域相关性的面向聚类数据扰动方法
  • 摘要

    针对面向聚类应用的隐私保护数据发布问题,引入邻域相关性概念,提出了一种基于邻域相关性的数据扰动算法NCDP,分析每个数据点邻域中与其邻域亲密的所有点以及邻域的平衡性,在不平衡情况下除去亲密集中可能的局部噪声数据点,向每个邻域亲密点进行一定长度的平移,得到扰动后的数据点.理论分析表明,扰动后的数据点不仅实现了对原始数值的保护,而且扰动前后数据点的邻域亲密点仍然维持亲密关系,从而保持了邻域的稳定性.实验采用k-means和DBSCAN聚类算法对扰动前后的数据进行聚类,并且与其他扰动算法进行了分析对比.实验结果表明,算法NCDP扰动前后的数据聚类结果有较高的相似度,可以较好地兼顾保护数据隐私与维持聚类可用性.

  • 作者

    张勇  倪巍伟  崇志宏  胡新平  Zhang Yong  Ni Weiwei  Chong Zhihong  Hu Xinping 

  • 作者单位

    东南大学计算机科学与工程学院,南京,210096

  • 刊期

    2011年z2期 ISTIC EI PKU

  • 关键词

    隐私保护数据发布  聚类分析  数据扰动  邻域相关性  邻域亲密  数据平移 

参考文献
  • [1] 武佳薇,李雄飞,孙涛,李巍. 邻域平衡密度聚类算法. 计算机研究与发展, 2010,6
  • [2] 周水庚,李丰,陶宇飞,肖小奎. 面向数据库应用的隐私保护研究综述. 计算机学报, 2009,5
  • [3] 倪巍伟,徐立臻,崇志宏,吴英杰,刘腾腾,孙志挥. 基于邻域属性熵的隐私保护数据干扰方法. 计算机研究与发展, 2009,3
  • [4] Agrawal R;Srikant R. Privacy preserving data mining. New York:ACM, 2000
  • [5] Benjamin C M;Wang Fung Ke;Wang Lingyu. Privacy-preserving data publishing for cluster analysis. Data and Knowledge Engineering, 2009,06
  • [6] Oliveira S R M;Zalane O R. Privacy preserving clustering by data transformation. Brazil:BDBComp Archive, 2003
  • [7] Rupa Parameswaran;Douglas M.Blough. Privacy preserving data obfuscation for inherently clustered data. International Journal of Information and Computer Security, 2008,02
  • [8] Han Jiawei;Micheline Kamber. 数据挖掘:概念与技术. 北京:机械工业出版社, 2001
  • [9] Oliveira S R M;Zalane O R. Achieving privacy preservation when sharing data for clustering. Beilin:Springer-Verlag, 2004
  • [10] Fung B C;Wang Ke;Wang Lingyu. A framework for privacy preserving cluster analysis. Los Alamitos.CA:IEEE Computer Society, 2008
查看更多︾
相似文献 查看更多>>
3.208.22.127