索引压缩

作品数:23被引量:34H指数:4
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:瞿有利刘洪健陈震陈英张远更多>>
相关机构:南开大学清华大学北京理工大学北京交通大学更多>>
相关期刊:《模式识别与人工智能》《山东大学学报(理学版)》《计算机工程与应用》《管理观察》更多>>
相关基金:国家自然科学基金国家重点基础研究发展计划中央高校基本科研业务费专项资金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于时间窗口聚类的时序数据索引压缩被引量:3
《计算机应用与软件》2022年第1期39-44,99,共7页刘璐 王鹏 汪卫 
子序列匹配是时间序列挖掘的经典课题,旨在发现大型数据集中的相似数据序列。很多文献关注固定时间段的序列的查询。但对于多种不同时间段的查询的问题仍然未解决好。基于时间段的查询含义是有时间窗口限制的查询。为了满足多时间段上...
关键词:时间序列索引压缩 相似性查询 多时间窗口查询 
编码单位可变的倒排索引压缩算法研究
《计算机工程与应用》2019年第15期82-88,共7页安兆翔 瞿有利 
中央高校基本科研业务费专项资金(No.2015JBM035)
倒排索引是大多数大型文本搜索系统的核心数据结构,索引压缩可以有效地减少倒排索引的空间占用,提升检索效率。针对倒排索引压缩算法中的字节对齐编码进行研究,对于其压缩率不够优秀的问题,提出了分区可变单位编码(PVU编码)。算法以可...
关键词:倒排索引 索引压缩 可变单位 分区优化 
一种倒排索引压缩方法被引量:6
《计算机应用研究》2019年第1期106-109,共4页白福均 高建瓴 李宛蓉 贺思云 肖绍武 
贵州省档案局科研资助项目(2015D001);贵州省科学技术基金资助项目(黔科合J字[2015]2045);贵州大学研究生创新基金资助项目(研理工2017014;研理工2017016)
针对自适应分段压缩ASCS算法进行了研究,对于ASCS算法中采用的均匀分段方式并非最优分段问题,提出以人工蜂群算法优化ASCS算法中的分段方式;对于ASCS算法考虑序列占用空间的影响因素过于单一问题,提出多因素下的改进算法;对于分布不均...
关键词:搜索引擎 倒排索引 索引压缩 人工蜂群算法 ASCS算法 
基于分区的Elias-Fano-Golomb-Rice倒排索引压缩算法
《计算机与现代化》2017年第9期33-39,共7页李俊廷 瞿有利 
中央高校基本科研业务费专项资金资助项目(2015JBM035)
基于分区的Elias-Fano算法被应用于倒排索引压缩,显示出良好的空间压缩性能。本文证明了Golomb-Rice算法的压缩性能优于Elias-Fano算法。结合基于分区的Elias-Fano算法中"分区"思想,提出一种基于分区的Elias-Fano-GolombRice倒排索引压...
关键词:倒排索引 索引压缩 分区 
倒排索引压缩在桌面搜索引擎中的应用被引量:2
《科技经济导刊》2017年第2期29-,46,共2页周慧 张蕾 吕兆龙 
在社会快速的发展过程,所产生的数据信息量越来越大,由于信息基数的数量较大,使得人们在数据检索应用中难度较大,需要花费大量的时间,才能完成查找。桌面搜索引擎的应用,能够保证用户在较短的时间内从大量的数据中获取自己所需要的数据...
关键词:桌面搜索 全文索引 倒排索引 索引压缩 
基于索引的快速手写中文文档关键词检索被引量:2
《模式识别与人工智能》2015年第11期1033-1040,共8页喻庚 殷飞 陈友斌 刘成林 
国家自然科学基金项目(No.61305005;61273269;61175021)资助
手写文档检索很难同时保证较高的检索精度和速度.基于上述原因,文中提出快速手写中文文档关键词检索方法,大幅提高检索速度并保持检索精度.该方法基于文本行识别的候选切分-识别网格预先生成压缩的索引文件,然后在索引上快速检索关键词...
关键词:手写中文文档图像 关键词检索 索引压缩 快速检索 
一个基于压缩后缀数组的乐纹索引算法
《计算机科学》2015年第S1期462-464 488,488,共4页刘学政 史有群 罗辛 陶然 
在基于乐纹的音乐检索系统中,提取的乐纹的多少决定了检索结果的匹配度,这就造成了数据库大小与检索匹配度不能兼顾的矛盾。提出使用压缩后缀数组来压缩乐纹索引的方法,解决全文索引时索引空间过大的问题。主要利用有序乐纹数据中较高...
关键词:乐纹 压缩后缀数组 索引压缩 游程编码 垂直编码 
倒排索引中的文档序号重排技术综述被引量:4
《中文信息学报》2015年第2期24-32,共9页史亮 张鸿 刘欣然 王勇 王斌 
国家973重点基础研究发展规划项目(2011CB302605);科技支撑计划(2012BAH47B04)
倒排索引作为文本搜索的核心索引技术,广泛应用于搜索引擎、桌面搜索和数字图书馆领域。倒排索引由字典和对应的倒排表组成,倒排表一般采用差值存储和整数编码进行压缩。研究表明,当倒排表具有较好的局部连续性时,上述方法能够获得很高...
关键词:搜索引擎 性能优化 索引压缩 文档序号重排 局部连续性 
一种变长编码压缩倒排索引算法
《山东大学学报(理学版)》2014年第12期30-35,共6页毛福林 瞿有利 
中央高校基本科研业务费专项资金项目(2011JBM231)
全文检索的效率依赖于数据结构-倒排索引,存储倒排索引需要较大的硬盘存储空间。提出了一种新的压缩算法,主要用于倒排索引中文档标识符的压缩。对于给定的文档集合使用信息检索工具Terrier,使用不同的压缩算法压缩倒排索引中的文档标识...
关键词:倒排索引 整数压缩 索引压缩 
内存数据索引:以处理器为核心的性能优化技术被引量:1
《华东师范大学学报(自然科学版)》2014年第5期192-206,共15页董绍婵 周敏奇 张蓉 周傲英 
国家自然科学基金(61332006)
随着单机内存容量的持续上升,内存数据库技术逐渐取代传统磁盘数据库为数据管理提供更快速的支持.本文分析了设计内存索引结构所需要考虑的基本要素;对目前的内存索引结构进行了分类总结,并分析各结构的优缺点;针对当前应用发展趋势,指...
关键词:内存索引 cache利用率 分布式内存数据库 索引压缩 
检索报告 对象比较 聚类工具 使用帮助 返回顶部