登录 | 注册 | 充值 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
一种基于CHI值特征选取的粗糙集文本分类规则抽取方法
  • 摘要

    结合文本分类规则抽取的特点,给出了近似规则的定义.该方法首先利用CHI值进行特征选取并为下一步特征选取提供特征重要性信息,然后使用粗糙集对离散决策表继续进行特征选取,最后用粗糙集抽取出精确规则或近似规则.该方法将CHI值特征选取和粗糙集理论充分结合,避免了用粗糙集对大规模决策表进行特征约简,同时避免了决策表的离散化.该方法提高了文本规则抽取的效率,并使其更趋实用化.实验结果表明了这种方法的有效性和实用性.

  • 作者

    王明春  王正欧  张楷  郝玺龙  WANG Ming-chun  WANG Zheng-ou  ZHANG Kai  HAO Xi-long 

  • 作者单位

    天津大学,系统工程研究所,天津,300072;天津工程师范学院,数理系,天津,300222/天津大学,系统工程研究所,天津,300072/天津工程师范学院,数理系,天津,300222/天津海量软件公司,天津,300384

  • 刊期

    2005年5期 ISTIC PKU

  • 关键词

    CHI值  特征选取  粗糙集  文本分类规则 

参考文献
查看更多︾
相似文献 查看更多>>
34.204.52.4