一种并行计算平台KD-60上的可实时更新文本搜索  被引量:1

Real-time Text Search Based on Parallel Computing Platform KD-60

在线阅读下载全文

作  者:龙柏[1,2] 方维[1,2] 孙广中[1,2] 陈国良[1,2] 

机构地区:[1]中国科学技术大学计算机科学与技术学院,合肥230026 [2]安徽省高性能计算重点实验室,合肥230026

出  处:《小型微型计算机系统》2012年第4期712-715,共4页Journal of Chinese Computer Systems

基  金:国家自然科学基金项目(60873210;61033009)资助;国家"八六三"高技术研究发展计划项目(2009AA01A134)资助;中央高校基本科研业务费专项基金项目资助

摘  要:实时性是影响搜索引擎性能的重要因素.针对这个因素,提出一种可实时更新的倒排索引结构并将其应用于国产万亿次高性能计算平台KD-60.该方案采用主、辅倒排索引和内容过滤索引相结合的方式,实现了搜索过程的实时性.同时,我们将其应用于高性能绿色计算平台KD-60,使之在一定的程度上实现了搜索的高效能.实验证明,基于KD-60平台的倒排索引结构有效的解决了搜索引擎的实时性问题,并可作为绿色计算的实际应用的一个典型实例.Real-time is an important factor which is affect performance of search engines. This paper presents a real-time updating in- verted index structure to improve performance of search engines. This structure consists of main/assist inverted index and content illtrating index, instead of the single model of classical inverted index. Based on this inverted index structure, we implement a real BBS Search engine. At the same time, we implement this new inverted index structure on the Tera Flops Domestic high performance green computing platform KD-60 to achieve real-time and energy-efficient performance in search processing. Experiments show that the in- verted index structure based on KD-60 system solves the real-time updating problem of inverted index well, and reaches energy-efficient performance on the practical applications of green computing.

关 键 词:搜索引擎 倒排索引 KD-60 绿色计算 效能 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象