登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
基于多视图Tri-Training的微博用户性别判断
  • 摘要

    互联网技术不断发展, 新浪微博作为公开的网络社交平台拥有庞大的活跃用户. 然而由于用户数量庞大, 且个人信息并不一定真实, 造成训练样本打标困难. 本文采用了一种多视图tri-training的方法, 构建三个不同的视图,利用这些视图中少量己打标样本和未打标样本不断重复互相训练三个不同的分类器, 最后集成这三个分类器实现用户性别判断. 本文用真实用户数据进行实验, 发现和单一视图分类器相比, 使用多视图tri-training学习训练后的分类器准确性更好, 且需要打标的样本更少.

  • 作者

    孙启蕴  SUN Qi-Yun 

  • 作者单位

    南京烽火软件科技有限公司, 南京 210019;武汉邮电科学研究院 通信与信息专业, 武汉 430073

  • 刊期

    2018年2期 ISTIC

  • 关键词

    性别判断  多视图学习  tri-training算法  数据挖掘  gender recognition  multi-view learning  tri-training  data mining 

相似文献 查看更多>>
34.226.244.70