基于Agent和XML的Web页面信息抽取研究与设计  被引量:6

Research and design of web information extraction based on agent and XML

在线阅读下载全文

作  者:孟宪福[1] 狄慧[1] 

机构地区:[1]大连理工大学计算机系,辽宁大连116024

出  处:《计算机工程与设计》2004年第8期1411-1414,共4页Computer Engineering and Design

摘  要:在以前相关研究的基础上,提出了一个建立在Agent和XML基础上的Web页面信息抽取的原型系统。在这个原型系统里,利用Agent的自治能力和合作能力来协助用户对抽取请求进行公式化表述和结合知识库学习抽取规则等。另外,系统还用XML语言描述抽取请求和抽取规则,在其中加入一些语义信息,这些语义信息可被有效利用,从而提高抽取的精确性。An agent and XML based webIE (web information extraction) framework is presented that utilizes some existing methods of the former related researches. In the framework, the autonomy and coordination of agent are employed to assist user formulate extraction queries, to learn extraction rules on the base of knowledge bases and so on. In addition, XML language is employed to describe extraction queries and extraction rules in which some semantic information is added. The semantic information can be efficiently used to enhance the extraction preciseness.

关 键 词:抽取规则 WEB页面 信息抽取 原型系统 XML语言 请求 知识库 合作能力 自治能力 求和 

分 类 号:TP393[自动化与计算机技术—计算机应用技术] TP391[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象