HTMLParser提取网页超链接研究  被引量:1

HTMLParser Extract Web Page Hyperlink Research

在线阅读下载全文

作  者:郎凤举[1] 

机构地区:[1]中国海洋大学信息科学与工程学院,青岛266100

出  处:《电脑编程技巧与维护》2010年第2期74-75,共2页Computer Programming Skills & Maintenance

摘  要:每个网页中都存在许多超链接,很多网页的有用信息都存在于超链接中,如何有效地获取这些超链接成为Web挖掘的一个重要步骤。提出了利用HTMLParser开源工具实现Web页面解析,提取网页的超链接,从而获取有用信息,为下一步开发搜索引擎做准备。There are many hyperlinks in each Web page, many pages of useful information exist the hyperlink, how to effectively access to these hyperlinks as an important step in Web mining. We propose the use of open source tools to achieve Web page HTMLParser parse, extract web page hyperlink in order to gain useful information for further development of search engine preparation.

关 键 词:HTMLPARSER 页面解析 信息提取 

分 类 号:TP393.092[自动化与计算机技术—计算机应用技术] TP311.13[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象