基于XML的信息抽取和多层向量空间技术研究被引量：4

Research on Information Extraction and Multilayer Vector Space Based on XML Technology

出　　处：《计算机技术与发展》2007年第7期49-52,共4页Computer Technology and Development

基　　金：江苏省高技术研究项目(BG2005019);教育部"高校博士点科研基金项目"(20040285016);教育部科研重点项目(205059)

摘　　要：在分析了传统索引技术的缺陷的基础上,提出了一种基于XML架构信息抽取的多层向量空间的模型,重点阐述了如何建立一个基于XML的Web信息抽取平台,从构造知识库、网页优化和信息抽取这三方面进行研究,并阐述了基于XML的多层向量空间模型及其形成。通过这种技术不仅使网页内容得到了清晰的剖析和抽取,更能大大提高对Web网页文档检索效率和准确率。目的在于寻求一种更为高效简洁的检索方法。By analyzing the limitations of traditional searching technolcgy, proposes a platform of Web information extraction based on XML and a model of searching technology based on XML construction and multilayer vector space, both of which greatly improve the efficiency of indexing documents. This model not only anatomizes and extracts the documents clearly, but also promotes the efficiency of Web documents searching. The main purpose of it is to find a more efficient and compact searching method.

关键词：XML架构信息抽取 N层向量空间模型

分类号：TP311[自动化与计算机技术—计算机软件与理论]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于XML的信息抽取和多层向量空间技术研究被引量：4

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于XML的信息抽取和多层向量空间技术研究 被引量：4

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于XML的信息抽取和多层向量空间技术研究被引量：4