登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
改进的并行随机森林算法及其包外估计
  • 摘要

    传统的包外估计记录全局数据与树之间的对应关系来测算泛化误差.然而基于MapReduce机制的并行随机森林算法(MR_RF)是建立在多个互不可见的分块数据上.对此分析MR_RF与RF的区别,设计了一个新的适用于MR_RF的包外泛化误差估计方法.主要将测算限定在数据块内,最终森林的泛化误差估计取块结果的平均.实验结果表明,新的包外估计方法与交叉验证在默认分块上的结果近似,却随着分块的增加出现偏差,对此分析了可能的原因,并给出选择集成方案思想,且分块大小与分类准确率成反比,与分类速率成正比.

  • 作者

    钱雪忠  秦静  宋威  Qian Xuezhong  Qin Jing  Song Wei 

  • 作者单位

    江南大学物联网技术应用教育部工程研究中心,江苏无锡,214122

  • 刊期

    2018年6期 ISTIC PKU

  • 关键词

    MapReduce  随机森林  包外估计  泛化误差  交叉验证 

相似文献 查看更多>>
3.233.220.21