基于Agent的Web页面结构化信息抽取  

Agent-Based Structured Information Extraction from Web Pages

在线阅读下载全文

作  者:岳国伟[1] 梁永全[1] 

机构地区:[1]山东科技大学信息科学与工程学院,青岛,266510 山东科技大学信息科学与工程学院,青岛,266510

出  处:《计算机研究与发展》2007年第z2期344-349,共6页Journal of Computer Research and Development

基  金:国家自然科学基金项目(70371052)

摘  要:结合当前Web站点的数据特点,以信息项在页面中的出现位置为信息抽取的路径,利用PAT树技术,提出了一个多Agent协作的自动信息抽取模型.该模型能够自动分析样本页面数据特征,归纳学习整个站点的数据模式,生成抽取规则,指导以后的抽取动作.实验结果表明,该模型对Web页面的结构化信息抽取具有较高的效率.

关 键 词:智能体 PAT树 信息抽取 WEB 

分 类 号:TP274[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象