哈尔滨工业大学基础与交叉科学研究院高性能计算中心

作品数:6被引量:39H指数:4
导出分析报告
发文领域:自动化与计算机技术文化科学电子电信更多>>
发文主题:海量数据查询处理外存磁盘缓存敏感更多>>
发文期刊:《计算机研究与发展》《计算机学报》更多>>
所获基金:国家自然科学基金国家重点基础研究发展计划教育部“新世纪优秀人才支持计划”黑龙江省教育厅科学技术研究项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一机构
结果分析中...
条 记 录,以下是1-6
视图:
排序:
外存中高效的字符串相似性查询处理被引量:3
《计算机研究与发展》2015年第3期738-748,共11页王金宝 高宏 李建中 杨东华 
国家"九七三"重点基础研究发展计划基金项目(2006CB303005);国家自然科学基金项目(60903016;60533110;60773063;61272046);教育部新世纪优秀人才支持计划基金项目(NCET-05-0333);黑龙江省教育厅科学技术研究项目(11531276);中国博士后科学基金第六批特别资助项目(2013T60372);黑龙江省自然科学基金项目(F201317);中央高校基本科研业务费专项资金项目(HIT.NSRIF.2015065)
字符串相似性查询是众多应用的基础操作,如数据清洁、拼写校验、生物信息学和信息集成等.随着数据的爆炸性增长,大规模字符串数据日益普遍,现代的信息系统中也广泛使用字符串作为数据的表达形式.现有支持字符串相似性查询的方法大多是基...
关键词:字符串 相似性查询 外存 查询处理 编辑距离 
RB树:一种支持空间近似关键字查询的外存索引被引量:9
《计算机研究与发展》2012年第10期2142-2152,共11页王金宝 高宏 李建中 杨东华 
国家"九七三"重点基础研究发展计划基金项目(2006CB303005);国家自然科学基金项目(60903016;60533110;60773063);教育部新世纪优秀人才支持计划基金项目(NCET-05-0333);黑龙江省教育厅科学技术研究项目(11531276)
空间近似关键字查询包含一个空间条件和一组关键字相似性条件,这种查询在空间数据库中返回同时满足以下条件的对象:1)对象的位置信息满足查询中的空间条件;2)对于查询中的任何一个关键字,对象中至少包含一个关键字与其相似度大于给定阈...
关键词:空间数据库 关键字 查询处理 索引 外存 
RM树:一种支持字符串相似性操作的索引被引量:6
《计算机学报》2011年第11期2142-2154,共13页王金宝 高宏 李建中 杨东华 
国家"九七三"重点基础研究发展规划项目基金(2012CB316200);国家自然科学基金(60903016;61003046;60533110;60773063;61173022);黑龙江省自然科学基金(F201031);中国博士后科学基金(20110491064);黑龙江省博士后基金(LBH-Z09140);哈工大科研创新基金"中央高校基本科研业务费专项资金"(HIT.NSRIF.2010060);哈工大优秀青年教师培养计划(HITQNJS2009.063)资助
字符串相似性操作在很多领域中被广泛应用,如数据清洁、信息集成等.现有研究工作主要为基于q-Gram和倒排索引的内存方法,在处理大量数据时具有以下缺点:内存消耗大、更新效率低、支持操作类型有限.现有的外存索引Bed树无法将相似的字符...
关键词:字符串 相似性 索引 查询处理 连接处理 
海量数据上的近似连接聚集操作被引量:3
《计算机学报》2010年第10期1919-1933,共15页韩希先 杨东华 李建中 
国家"九七三"重点基础研究发展规划项目基金(2006CB303005);国家自然科学基金(60903016;60533110;60773063);新世纪优秀人才支持计划(NCET-05-0333);黑龙江省教育厅科学技术研究项目(11531276);NSFC-RGC of China(60831160525)资助~~
连接聚集操作是一种常用并且非常耗时的数据库操作.相对于准确查询,满足用户给定置信区间的近似结果由于其快得多的响应时间,更受用户的欢迎.作者分析发现现有的工作无法以既高效又满足给定的任意置信区间方式来处理近似连接聚集,因此...
关键词:pε-近似连接聚集 连接位置索引对表 连接随机样本 海量数据 
TKEP:海量数据上一种有效的Top-K查询处理算法被引量:16
《计算机学报》2010年第8期1405-1417,共13页韩希先 杨东华 李建中 
国家"九七三"重点基础研究发展规划项目基金(2006CB303005);国家自然科学基金(60903016;60533110;60773063);新世纪优秀人才支持计划(NCET-05-0333);黑龙江省教育厅科学技术研究项目(11531276);NSFC-RGC of China(60831160525)资助~~
在许多应用领域中,top-k查询是一种十分重要的操作,它根据给定的评分函数在潜在的巨大的数据空间中返回k个最重要的对象.不同于传统的TA算法,NRA算法只需要顺序读就可以处理top-k查询,从而适合于随机读受限或不可能的场合.文中详细地分...
关键词:海量数据 TOP-K 早剪切 TKEP 
DBCC-Join:一种新的高速缓存敏感的磁盘连接算法被引量:4
《计算机学报》2010年第8期1500-1511,共12页韩希先 杨东华 李建中 
国家"九七三"重点基础研究发展规划项目基金(2006CB303005);国家自然科学基金(60903016;60533110;60773063);新世纪优秀人才支持计划(NCET-05-0333);黑龙江省教育厅科学技术研究项目(11531276);NSFC-RGC of China(60831160525)资助~~
随着CPU和内存的性能差距越来越大,系统设计者在CPU寄存器和内存之间插入高速缓存来弥补这个差距.高速缓存的数据存取速度远高于内存,所以数据库操作要获得更好的性能就必须考虑充分利用高速缓存.基于磁盘的连接操作是一种常用并且耗时...
关键词:DBCC-Join JPIPT构建阶段 结果输出阶段 缓存敏感算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部