检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:柴变芳[1] 傅玥[1] 安素芳[1] 胡吉朝[1]
机构地区:[1]石家庄经济学院信息工程学院,河北石家庄050031
出 处:《教育技术导刊》2008年第3期42-43,共2页Introduction of Educational Technology
摘 要:对当前的XML索引需要改进的地方进行分析,给出了一个较通用的索引机制。首先提出一种XML文档编码规则,在此基础上设计支持路径查询和信息检索的索引结构,并给出了对文档重复元素和文本节点索引词汇进行归并处理的索引算法。索引算法只需对文档遍历一次,所得到的索引文件占用空间也比GUID和倒排文档少,并且利用这些索引文件能实现任意粒度、任意形式的内容、结构和属性查询。To analyze the needful improvements of XML indexes in recent, a more current index mechanism is designed. Firstly a simple numbering rule is put forward. On the rule the index structure is designed for path query and IR, and an indexing algorithm is provided to merge the repeated elements and the index words in the text node. The index algorithm needs scan only once to the documents, and then can get the indexes whose spaces are smaller than GUID’s and inverted file’s. Using these indexes can implement content and structure retrieval in any granularity and any formal.
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30