登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
基于粗糙集的两阶段邮件过滤方法
  • 摘要

    如何将邮件的头信息和内容信息有效结合起来进行垃圾邮件过滤备受研究人员的关注.基于粗糙集具有很好地处理不确定信息的特点,提出了一种基于粗糙集的两阶段邮件过滤方法,首先根据邮件头信息将其分为正常邮件、垃圾邮件和可疑邮件,再根据邮件内容将可疑邮件分为正常和垃圾邮件.通过在中英文邮件集上的测试实验,证明了所提出的邮件过滤方法不仅能提高垃圾邮件过滤的准确率,而且能大幅降低误杀率.

  • 作者

    邓维斌  洪智勇  DENG Wei-bin  HONG Zhi-yong 

  • 作者单位

    重庆邮电大学,电子商务与现代物流实验室,重庆,400065;西南交通大学,信息科学与技术学院,成都,610031/西南交通大学,信息科学与技术学院,成都,610031

  • 刊期

    2010年8期 ISTIC PKU

  • 关键词

    粗糙集  朴素贝叶斯  特征选择  垃圾邮件过滤 

参考文献
  • [1] 李志君,王国胤,吴渝. 基于Rough Set的电子邮件分类系统. 计算机科学, 2004,3
  • [2] 邓维斌,黄蜀江,周玉敏. 基于条件信息熵的自主式朴素贝叶斯分类算法. 计算机应用, 2007,4
  • [3] Chih-Chin Lai. An empirical study of three machine learning methods for spam filtering. Knowledge-based systems, 2007,3
  • [4] THIAGO S;GUZELLA;WALMIR M C. A review of machine learning approaches to spam filtering. Expert Systems with Applications, 2009,07
  • [5] DEEPSOFT. Spamassassin project. http://spamassassin.apache.org/publiccorpus/, 2007-05-10
  • [6] CCERT 2005-Jul数据集. 北京:中国教育和科研计算机网紧急响应组, 2005
  • [7] WANG G Y;ZHENG Z;YU W. Ridas-a rough set based intelligent data analysis system. Washington,DC:IEEE, 2002
  • [8] SAHAMI M;DUMAIS S;HECKERMAN D. A Bayesian approach to filtering junk email. http://research.microsoft.com/en-us/um/people/horvitz/junkfilter.htm, 2009-12-11
  • [9] KIM J;CHUNG K;CHOI K. Spam filtering with dynamically updated URL statistics. IEEE Security and Privacy, 2007,04
  • [10] CHEN X L;LIU P Y;ZHU Z F. A method of spam filtering based on weighted support vector machines. Washington,DC:IEEE, 2009
  • [11] PAWLAK Z. Rough set. International Journal of Computer and Information Sciences, 1982,05
  • [12] 王国胤. Rough集理论与知识获取. 西安:西安交通大学出版社, 2001
  • [13] LAI G-H;CHEN C-M;LAIH C-S. A collaborative antispam system. Expert Systems with Applications, 2009
查看更多︾
相似文献 查看更多>>
3.235.75.196