检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:卞艺杰[1] 陈超[1] 李亚冰[1] 陆小亮[1]
机构地区:[1]河海大学,南京211100
出 处:《计算机系统应用》2014年第2期183-188,共6页Computer Systems & Applications
摘 要:机构知识库作为一种新型的学术交流模式和开放获取活动的绿色通道已逐渐成为国内外图书情报界关注的新焦点,随着机构库的发展其数据规模也在不断扩大,传统的存储模式已经不能满足日益增长的存储需求.在对机构库内容存储特点的研究基础上建立基于HDFS与Dspace的分布式机构库Hdspace.首先提出一种小文件合并生成新的存储文件,并对文件提出基于学科分类的两级索引,结合索引预缓存机制提高小文件的读取响应,为海量小文件存储及后续的信息高效利用提供了一种解决方案,通过模拟测试显示本模式能够大大提高机构知识库小文件的存储、读取以及检索效率.The development of Institutional Repository requires a massive resource accumulation, the demand for storage keeps increasing especially for the small files. This article proposes a distributing storage model Hdspace which is based on Dapace and HDFS to resolve the problem of the storage of massive small files of Institutional Repository. First by a means of merging small document files to get new storage files, then by establishing two indexes based on subjects and index pre-caching to improve the file-reading response, f'mally put forward a method for the storage of massive small files.
分 类 号:TP333[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.148.211.202