登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
基于主题语义 URL 的信息搜索方法研究
  • 摘要

    为提高主题网络爬虫的效率及收获率,提出一种基于主题语义 URL 的信息搜索方法。该方法将种子 URL 映射到主题树的主题结点上,以主题路径上的主题文本扩充种子 URL 的语义,引导爬虫高效准确地抓取主题页面,并利用链接重要度与页面重要度因子在抓取过程中自动选育新的 URL 优良种子。重点阐述上述搜索方法的原理及其在系统中的实现。实验结果表明,该搜索方法能有效改善网络爬虫的搜索效率及收获率,且种子链接的选育性能良好。

  • 作者

    林晶  彭小宁  Lin Jing  Peng Xiaoning 

  • 作者单位

    怀化学院计算机工程系 湖南 怀化 418008

  • 刊期

    2015年6期 ISTIC

  • 关键词

    主题树  URL  语义  搜索引擎  主题-URL  映射  Topic tree  URL semantics  Search engine  Topic-URL mapping 

参考文献
查看更多︾
相似文献 查看更多>>
34.226.244.70