登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
基于多重进化矩阵的蛋白质特征向量构造方法
  • 摘要

    特征向量的构造是蛋白质二级结构预测的一个关键间题. 现有的研究方法, 通常只使用BLOSUM62进化矩阵生成PSSM矩阵, 对蛋白质进化过程中存在的氨基酸残基突变现象缺乏考虑. 本文提出利用多重进化矩阵构造蛋白质特征向量, 其融合了不同进化时间的PSSM矩阵, 不仅能够很好地反映序列中氨基酸的位置信息, 而且能够反映序列进化过程中氨基酸位点发生突变产生的影响. 本文通过组合不同进化程度的矩阵来构造特征向量, 选用逻辑回归、随机森林和多分类支持向量机三种分类算法作为预测工具, 利用网格搜索法和交叉实验法优化参数, 在RS126、CB513和25PDB公用数据集上进行了若干组实验. 对比实验结果表明, 本文所提出基于多重进化矩阵的蛋白质特征向量构造方法能够有效提高蛋白质二级结构的预测精度.

  • 作者

    杜月寒  鹿文鹏  刘毅慧  成金勇  DU Yue-Han  LU Wen-Peng  LIU Yi-Hui  CHENG Jin-Yong 

  • 作者单位

    齐鲁工业大学(山东省科学院) 信息学院,济南,250353

  • 刊期

    2018年2期 ISTIC

  • 关键词

    蛋白质结构预测  多重进化矩阵  逻辑回归  随机森林  多分类支持向量机  protein secondary structure prediction  multiple evolutionary matrix  logistics  randomforest  M-SVMCS 

相似文献 查看更多>>
34.226.244.70