基于主动学习的Web页面信息抽取  被引量:5

在线阅读下载全文

作  者:张清军[1] 朱才连[1] 

机构地区:[1]中国科学院测量与地球物理研究所,武汉430077

出  处:《情报学报》2004年第6期667-671,共5页Journal of the China Society for Scientific and Technical Information

摘  要:本文提出一种基于主动学习的Web页面信息抽取方法,可以使用户在标记少量具有代表性的样本页面的情况下,有效地提高信息抽取规则的覆盖性,从而使包装器具有一定的自适应性。

关 键 词:信息抽取 WEB页面 包装器 自适应性 规则 用户 标记 主动学习 情况 样本 

分 类 号:G633[文化科学—教育学] TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象