登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
基于互信息的粒化特征加权多标签学习k近邻算法
  • 摘要

    传统基于k近邻的多标签学习算法,在寻找近邻度量样本间的距离时,对所有特征给予同等的重要度.这些算法大多采用分解策略,对单个标签独立预测,忽略了标签间的相关性.多标签学习算法的分类效果跟输入的特征有很大的关系,不同的特征含有的标签分类信息不同,故不同特征的重要度也不同.互信息是常用的度量2个变量间关联度的重要方法之一,能够有效度量特征含有标签分类的知识量.因此,根据特征含有标签分类知识量的大小,赋予相应的权重系数,提出一种基于互信息的粒化特征加权多标签学习k近邻算法(granular feature weighted k-nearest neighbors algorithm for multi-label learning,GFWML-kNN),该算法将标签空间粒化成多个标签粒,对每个标签粒计算特征的权重系数,以解决上述问题和标签组合爆炸问题.在计算特征权重时,考虑到了标签间可能的组合,把标签间的相关性融合进特征的权重系数.实验表明:相较于若干经典的多标签学习算法,所提算法GFWML-kNN整体上能取得较好的效果.

  • 作者

    李峰  苗夺谦  张志飞  张维  Li Feng  Miao Duoqian  Zhang Zhifei  Zhang Wei 

  • 作者单位

    同济大学计算机科学与技术系 上海201804/嵌入式系统与服务计算教育部重点实验室(同济大学) 上海201804

  • 刊期

    2017年5期 ISTIC EI PKU

  • 关键词

    互信息  特征权重  粒化  多标签学习  k-近邻  mutual information  feature weight  granulation  multi-label learning  k-nearest neighbors 

相似文献 查看更多>>
3.233.215.231