登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
分类问题的一种可伸缩特征选择算法
  • 摘要

    特征选择是数据挖掘分类中的一个重要问题.该文推导出一种新的衡量特征与类别相关度的测度SCD即描述特征取值序列类分布的CV系数,利用该测度给出一种线性的可伸缩特征选择算法StaFSOS,并证明了在类别数为2时,SCD测度满足分支界限法的单调性;给出了StaFSOS的一个完备形式--BBStaFS.在12个标准数据集中,StaFSOS算法得出的结果和目标集几乎一致,而StaFSOS的效率高于其它算法;而在另1个中,BBStaFS算法得出了准确结果.在用1000个样本20个特征的真实数据进行的测试中,StaFSOS运行时间是目前较快的GRSR的1/2,得出的特征集准确有效.

  • 作者

    张巍  邹翔  吴晓如  ZHANG Wei  ZOU Xiang  WU Xiao-ru 

  • 作者单位

    中国科学技术大学电子工程与信息科学系,合肥,230027/中国科学技术大学计算机科学技术系,合肥,230027/安徽中科大讯飞信息科技有限公司,合肥,230088

  • 刊期

    2005年7期 ISTIC EI PKU

  • 关键词

    数据挖掘  分类  特征选择 

参考文献
  • [1] 范劲松,方廷健. 特征选择和提取要素的分析及其评价. 计算机工程与应用, 2001,13
  • [2] 何劲松,施泽生. 特征选择方法中的信号分析方法研究. 中国科学技术大学学报, 2001,1
  • [3] 张祥德,张巍,刘玉蓉. 数据挖掘分类问题的贪婪粗糙集约简算法. 东北大学学报(自然科学版), 2001,5
  • [4] Agrawal R;Imielinski T;Swami A. Database mining: A performance perspective. IEEE Transactions on Knowledge and Data Engineering, 1993,06
  • [5] . http://www.ics.uci.edu/~mlearn/MLRepository.html
  • [6] Sheinvald J;DomB;Niblack W. A modelling approach to feature selection. 1990
  • [7] Li H.X;Xu L.D. Feature space theory: A mathematical foundation for data mining. Knowledge-Based Systems, 2001
  • [8] 周光亚;赵文;赵振全. 多元统计方法. 长春:吉林大学出版社, 1988
  • [9] Almuallim H;Dietterich T.G. Learning with many irrelevant features. Cambridge, Massachusetts, 1992
  • [10] Narendra P.M;Fukunaga K. A branch and bound algorithm for feature selection. IEEE Transactions on Computers, 1977,09
  • [11] Kira K;RendellLA. The feature selection problem:traditional methods and a new algorithm. 1992
  • [12] Cardie C. Using decision trees to improve case-based learning. 1993
  • [13] Ucciardi A.N;Gose E.E. A comparison of seven techniques for choosing subsets of pattern recognition. IEEE Transactions on Computers, 1971
  • [14] LIU H;Setiono R. A probabilistic approach to feature selection: A filter solution. 1996
  • [15] LIU H;Setiono R. Feature selection and classification: A probabilistic wrapper approach. 1996
  • [16] Dash M;Liu H. Feature selection for classification. Intelligent Data Analysis, 1997
  • [17] Kohavi R. Feature subset selection using the wrapper method: Overfitting and dynamic search space topology. 1994
  • [18] Han J;Kamber M. Data Mining Concepts and Techniques. Morgan Kaufmann, 2000
  • [19] Skowron R.A;Suraj Z. Discovery of concurrent data from experimental data tables: A rough set approach. Institute of Computer Science, Warsaw University of Technology, Research Report, 1995
  • [20] Zhong N;Dong J. Using rough sets with heuristics for feature selection. Journal of Intelligent Information Systems, 2001
  • [21] Swiniarski R.W;Skowron A. Rough set methods in feature selection and recognition. Pattern Recognition Letters, 2003
  • [22] Pedrycz W;Vukovichc G. Feature analysis through information granulation and fuzzy sets. Pattern Recognition, 2002
  • [23] Siedklecki W;Sklansky J. On automatic feature selection. International Journal of Pattern Recognition and Artificial Intelligence, 1988
查看更多︾
相似文献 查看更多>>
35.172.216.157