复杂Web页的Wrapper自动化生成技术研究  

The Study of Automatic Generation of Wrapper for Data Extraction from Complex Web

在线阅读下载全文

作  者:陈洪平[1] 方巍[1] 李林[1] 崔志明[1] 

机构地区:[1]苏州大学智能信息处理及应用研究所,江苏苏州215006

出  处:《微电子学与计算机》2010年第4期62-65,共4页Microelectronics & Computer

基  金:国家自然科学基金项目(60673092);江苏省重大科技支撑与自主创新项目(BE2008044);江苏省"六大人才高峰"项目(06-E-037)

摘  要:针对基于模板生成Web页的基本特点,结合Ontology知识,探索Deep Web垂直搜索中,复杂Web页面的Wrapper自动化生成的解决方案.对实际复杂Web页面抽取的实验结果表明,该方法达到了较高的抽取准确率.According to characteristic of the template-based Web-pages, combing the ontology, this paper proposes a method to solve the problem of automatic generation of wrapper for complex Web pages in the deep Web vertical-search condition. Experimental evaluation on a number of real complex Web page collections indicates that our method can gain a high extraction precision.

关 键 词:本体 数据抽取 包装器 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象