一种自适应的Web信息抽取规则自动生成方法被引量：5

An Automatic Generating Method of Adaptable Web Information Extraction Rule

机构地区：[1]国家农业信息化工程技术研究中心,北京100097 [2]农业部农业信息技术重点开放实验室,北京100097

出　　处：《广西师范大学学报（自然科学版）》2010年第1期127-130,共4页Journal of Guangxi Normal University:Natural Science Edition

基　　金：国家自然科学基金资助项目(60871042);国家农业部"948"项目(2006-G63);国家863计划资助项目(2007AA10Z235;2007AA01Z179);国家科技支撑计划项目(2008BADA0B05)

摘　　要：提出一种自适应的Web信息抽取规则自动生成方法,通过多样本页面对比模式和单样本重复模式提取Web上复合类型的数据并进行迭代修正,基于语义分析的规则方法进行动态抽取。实验结果表明,该方法具有较好的精确性和鲁棒性。An automatic generating method of adaptable Web information extraction rule is proposed, which extracts data of complex type on the Web and revises iteration by comparing with multi-sampling page and discovering repeat pattern in one-sample and extracts dynamic base on method of semantic analysis rules. Experimental results show that the method performs well in both precision and robustness.

关键词：信息抽取语义分析自适应方法

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种自适应的Web信息抽取规则自动生成方法被引量：5

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种自适应的Web信息抽取规则自动生成方法 被引量：5

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

一种自适应的Web信息抽取规则自动生成方法被引量：5