检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:郎凤举[1]
机构地区:[1]中国海洋大学信息科学与工程学院,青岛266100
出 处:《电脑编程技巧与维护》2010年第2期74-75,共2页Computer Programming Skills & Maintenance
摘 要:每个网页中都存在许多超链接,很多网页的有用信息都存在于超链接中,如何有效地获取这些超链接成为Web挖掘的一个重要步骤。提出了利用HTMLParser开源工具实现Web页面解析,提取网页的超链接,从而获取有用信息,为下一步开发搜索引擎做准备。There are many hyperlinks in each Web page, many pages of useful information exist the hyperlink, how to effectively access to these hyperlinks as an important step in Web mining. We propose the use of open source tools to achieve Web page HTMLParser parse, extract web page hyperlink in order to gain useful information for further development of search engine preparation.
关 键 词:HTMLPARSER 页面解析 信息提取
分 类 号:TP393.092[自动化与计算机技术—计算机应用技术] TP311.13[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.145.71.161