XML搜索引擎研究  被引量:40

Research of XML Search Engine

在线阅读下载全文

作  者:王海波[1] 姜吉发[1] 耿晖[1] 白硕[1] 祝明发 

机构地区:[1]中国科学院计算技术研究所,北京100080 [2]中国国家智能信息中心,北京100080

出  处:《计算机应用研究》2001年第4期68-71,共4页Application Research of Computers

摘  要:WWW上大量信息的涌现,对信息的查询提出了严峻的挑战.XML作为一种扩展标记语言,具有许多HTML所不具备的优点,使得开展WWW上的深层应用成为可能.对基于XML的搜索引擎中涉及的关键技术进行了研究,并提出了对XML这种半结构化文档建立索引和查询时采用的数据结构和算法.它在不丢失文档中结构信息的情况下,充分利用XML的标签所带来的上下文信息,能够大幅度提高查询的准确率.In recent years, many documents are beginning to be provided in the structured format of XML. However, conventional information retrieval techniques do not scale up well in XML documents. This paper gave a research to several key techniques inside XML. search engine. It utilizes the context information in XML document to promote the ratio of accuracy of query. It discussed the details of spider technique and structure of the index file. It Saved the hierarchy relation of tag with a low storing overhead.

关 键 词:XML 搜索引擎 信息检索 WWW INTERNET 

分 类 号:G354.4[文化科学—情报学] TP393.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象