抽取Web信息的包装器归纳学习构造  被引量:2

Wrapper Induction Generation for Extracting the Web Infomation

在线阅读下载全文

作  者:汤艳红[1] 李石君[1] 黄竞伟[1] 

机构地区:[1]武汉大学计算机学院,武汉430072

出  处:《计算机工程》2003年第17期60-62,共3页Computer Engineering

基  金:国家自然科学基金项目(60173045);武汉大学青年科研基金项目(9910)

摘  要:开发Web信息集成系统的关键是为需集成的各个Web信息源构造包装器。鉴于存在的HTLR类包装器对需抽取信息的Web页限制过严,影响了其表达能力,该文扩展了HTLR,提出了DHTLR类包装器的概念和归纳学习构造算法,较HTLR增强了表达能力,能适用于更广泛的信息源。The key component in the Web information integration system is the wrapper construction for each Web sites needed. To deal with this problem that existing HTLR class of wrapper is too restrict to the Web pages extracted and narrow the applicability, this paper extends the HTLR wrapper, presenting the DHTLR class of wrapper and the induction generation algorithm. The DHTLR wrapper improves the HTLR wrapper , so its more applicable and can be used in more Web sites.

关 键 词:信息集成 信息抽取 包装器归纳学习 

分 类 号:TP393.09[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象