登录 | 注册 | 充值 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
基于顺序读取的分布式top-k查询算法
  • 摘要

    top-k查询是一种被广泛应用的操作,通过把已有top-k算法作为分析和研究的基础,根据现有算法所存在的不足提出自己的解决方案。提出SRTA( Sequential-Read Threshold Algorithm),相比NRA算法对数据的存储进行了重新的规划,创建一个新的表将内存上的开销转换到较廉价的外存开销,只需顺序读取就可以进行有效的top-k查询,同时将表进行了划分,在并行处理的情况下更能提高程序的效率,能够很好地运行在内存有限的环境中。在SRTA基础上提出的DSRTA(Distributed Sequential-Read Threshold Algorithm),适用于分布式环境中。 DSRTA先采用ID划分的方式把原有数据集划分为多个子空间,然后再进行数据规划,发挥分布式的性能优势,进一步提高了SRTA的查询效率。

  • 作者

    毕方明  陈伟  杨魁  车奔  BI Fangming  CHEN Wei?  YANG Kui  CHE Ben 

  • 作者单位

    中国矿业大学 徐州 计算机科学与技术学院,江苏 徐州,221116

  • 刊期

    2015年z1期 ISTIC PKU

  • 关键词

    分布式  数据存储  数据划分  顺序读取  内存有限  distributed  data storage  data partitioning  sorted access  limited memory 

参考文献
  • [1] 毛杰,余名高. 海量数据库查询优化研究. 软件导刊, 2010,5
  • [2] Thomas Neumann;Matthias Bender;Sebastian Michel;Ralf Schenkel;Peter Triantafillou;Gerhard Weikum. Distributed top-k aggregation queries at large. Distributed and parallel databases, 2009,1
  • [3] 吴超. 信息检索中top-k问题的并行算法及优化研究. 中国科学技术大学, 2011
  • [4] VLACHOU A;DOULKERIDIS C;NORVAG K. Distributed top-k query processing by exploiting skyline summaries. Distributed and Parallel Databases, 2012,3/4
  • [5] XIN D;CHEN C;HAN J. Towards robust indexing for ranked que-ries. VLDB Endowment, 2006
  • [6] PANG H H;DING X;ZHENG B. Efficient processing of exact top-k queries over disk-resident sortedlist. VLDB JOURNAL, 2010,03
  • [7] YA H;LI H;WU P. Ef icient processing of distributed top-k que-ries. Berlin:Springer-Verlag, 2005
  • [8] LA W;CHEN J;DA X. Efficient top-k approximate searches against a relation with multiple attributes. WORLD WIDE WEB, 2011,5/6
  • [9] 曾学. 海量数据快速查询算法研究. 南京:南京邮电大学, 2012
查看更多︾
相似文献 查看更多>>
18.204.48.40