登录 | 注册 | 充值 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
一种层次化的检索结果聚类方法
  • 摘要

    检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别标签抽取算法,并以抽取的标签构造基础类别图,通过GBCA算法构建层次化聚类结果.实验证明了多特征融合模型的有效性;GBCA算法在类别标签抽取和F-Measure两个评价指标上都比STC和Snaket算法有很大的提高.

  • 作者

    张刚  刘悦  郭嘉丰  程学旗  Zhang Gang  Liu Yue  Guo Jiafeng  Cheng Xueqi 

  • 作者单位

    中国科学院计算技术研究所,北京,100190

  • 刊期

    2008年3期 ISTIC EI PKU

  • 关键词

    信息检索  检索结果聚类  层次化聚类  文本聚类  聚类 

参考文献
  • [1] 王志梅,张俊林,李秋山. Web检索结果快速聚类方法的研究与实现. 计算机工程与设计, 2004,12
  • [2] Shi JB.;Malik J.. Normalized cuts and image segmentation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000,8
  • [3] M A Hearst;J O Pederseu. Reexamining the cluster hypothesis:Scatter/gather on retrieval results. New York:acm Press, 1996
  • [4] F Giannotti;M Nanni;D Pedreschi. Webcat:Automatic categorization of web search results. Italian:Rubbettino Editore, 2003
  • [5] Oren Zamir;Oren Etzioni. Web document clustering:A feasibility demonstration. New York:acm Press, 1998
  • [6] Hiroyuki Toda;Ryoji Kataoka. A search result clustering method using informatively named entities. New York:acm Press, 2005
  • [7] Florian Beil;Martin Ester;Xiaowei Xu. Frequent term-based text clustering. New York:acm Press, 2002
  • [8] H Zeng;Q He;Z Chen. Learning to cluster web search results. New York:acm Press, 2004
  • [9] Paolo Ferragina;Antonio Gulli. A personalized search engine based on Web-Snippet hierarchical clustering. New York:acm Press, 2005
  • [10] X He;H Zha;C Ding. Web document clustering using hyperlink structures[Tech Rep:CSE-01-006]. Department of Computer Science and Engineering,Pennsylvania State University, 2001
查看更多︾
相似文献 查看更多>>
34.239.160.113