登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
基于潜在语义索引和自组织映射网的检索结果聚类方法
  • 摘要

    随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论.提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型.在词条的权重中引入了语义关系.对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法.并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高.

  • 作者

    陈毅恒  秦兵  刘挺  王平  李生  Chen Yiheng  Qin Bing  Liu Ting  Wang Ping  Li Sheng 

  • 作者单位

    哈尔滨工业大学计算机学院信息检索研究室,哈尔滨,150001

  • 刊期

    2009年7期 ISTIC EI PKU

  • 关键词

    检索结果聚类  潜在语义索引  自组织映射网  标签  边界划分 

相似文献 查看更多>>
3.227.252.54