登录 | 注册 | 充值 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
结合改进主动学习的SVD-CNN弹幕文本分类算法
  • 摘要

    为解决传统卷积神经网络(CNN)模型使用池化层进行文本特征降维会损失较多文本语义信息的问题,提出一种基于奇异值分解(SVD)算法的卷积神经网络模型(SVD-CNN).首先,采用改进的基于密度中心点采样的主动学习算法(DBC-AL)选择对分类模型贡献率较高的样本进行标注,以低标注代价获得高质量模型训练集;然后,结合SVD算法建立SVD-CNN弹幕文本分类模型,使用奇异值分解的方法代替传统CNN模型池化层进行特征提取和降维,并在此基础上完成弹幕文本分类任务;最后,使用改进的梯度下降算法(PSGD)对模型参数进行优化.为了验证改进算法的有效性,使用多种弹幕数据样本集,对提出的模型与常用的文本分类模型进行对比实验.实验结果表明,改进的算法能够更好地保留文本语义特征,保证训练过程的稳定性并提高了模型的收敛速度,在不同的弹幕文本上较传统算法具有更好的分类性能.

  • 作者

    邱宁佳  丛琳  周思丞  王鹏  李岩芳  QIU Ningjia  CONG Lin  ZHOU Sicheng  WANG Peng  LI Yanfang 

  • 作者单位

    长春理工大学 计算机科学技术学院,长春,130022

  • 刊期

    2019年3期 ISTIC PKU

  • 关键词

    卷积神经网络  奇异值分解  主动学习  梯度下降  文本分类 

相似文献 查看更多>>
3.85.245.126