登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
基于MapReduce与距离的离群数据并行挖掘算法
  • 摘要

    数据挖掘技术是解决数据丰富而知识贫乏的有效途径, 离群数据挖掘是数据挖掘领域中的重要研究内容之一, 己广泛应用于网络入侵检测, 信用卡诈骗, 垃圾邮件的分析和基因突变分析等领域. 在高维海量数据中, 由于数据量大和维度高, 严重影响了离群数据挖掘的精度和效率. 本文在KNN基础上, 通过定义"解集"的概念, 在MapReduce编程环境下, 实现了一种基于距离的离群数据挖掘算法. 分别采用人工数据集和UCI数据集, 实验验证了该算法在不同条件下, 参数对算法性能的影响.

  • 作者

    任燕  REN Yan 

  • 作者单位

    山西省特殊教育中等专业学校,太原,030012

  • 刊期

    2018年2期 ISTIC

  • 关键词

    MapReduce  基于距离  KNN  离群数据挖掘  MapReduce  distance-based  KNN  outliers data mining 

相似文献 查看更多>>
3.233.221.149