基于模板的网页信息抽取技术研究  被引量:3

Research of web page information extraction technology based on the template

在线阅读下载全文

作  者:杨一柳[1] 

机构地区:[1]渤海大学大学计算机教研部,辽宁锦州121013

出  处:《渤海大学学报(自然科学版)》2013年第3期320-322,327,共4页Journal of Bohai University:Natural Science Edition

摘  要:准确挖掘网页中的信息对检索系统非常重要.提出了一种基于模板的网页信息抽取方法进行网页信息抽取.该方法采用网页抓取与数据模板技术实现了网页信息的自动发现与抽取.在Yahoo网站上的实验结果表明,该方法具有较好的检索效果.It is significant for retrieval system to mine information of web page. A method of extracting infor- mation in web page based on the template is used for extracting information. The technique of web crawler and data - template technology in this method could self - discover and self - extract the information of web page. The experimental results in Yahoo website indicate that this method is efficient for retrieval information.

关 键 词:模板 信息抽取 网络爬虫 

分 类 号:TP39[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象