登录 | 注册 | 充值 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
基于clustering算法的事务抽样关联规则挖掘算法
  • 摘要

    关联规则挖掘典型算法Apriori由于在频繁项集的生成时,需要多次扫描数据库,空间和时间耗费较大。之后虽然有很多Apriori算法的改进版本,但大多是从数据存储结构的角度,少有研究考虑到数据集本身的性质。对此提出了基于clustering算法的事务抽样关联规则挖掘算法,通过聚类技术对事务进行聚类,得出能够反映原始交易数据特征的事务子集,然后,在该子集上开展挖掘分析工作。该方法在8个不同规模人造数据集和1个真实数据集上进行了实验。其中,在较小规模人造数据集上,时间比原方法节省0.03 s;规模越大,节省时间越多,在大小为15000、维度为30的数据集上运行时,比原方法节省了70 s;在真实数据集上,不同参数设置下该方法耗时仅为原方法的50%。实验证明,该方法与传统Apriori算法相比,效率较高,尤其在数据量大时,效果提升更明显。该算法的思想也可以扩展应用到其他改进的Apriori算法中。

  • 作者

    马玉玲  MA Yuling? 

  • 作者单位

    山东英才学院 信息工程学院,济南,250014

  • 刊期

    2015年z2期 ISTIC PKU

  • 关键词

    聚类算法  事务子集  关联规则挖掘  Apriori算法  clustering algorithm  transaction subset  association rule mining  Apriori algorithm 

相似文献 查看更多>>
100.24.122.228