基于搜索引擎的邮址搜集软件开发  

在线阅读下载全文

作  者:赵瑞[1] 温正慧[1] 周平[1] 

机构地区:[1]浙江理工大学,杭州310018

出  处:《电脑编程技巧与维护》2014年第15期22-25,共4页Computer Programming Skills & Maintenance

摘  要:在百度、谷歌等现有搜索引擎基础上,利用HtmlParser开源框架,用Java语言开发了一种基于搜索引擎关键字的邮址搜集软件。提取邮址的过程包括页面链接的获取和页面邮址的提取。在获取页面链接阶段,首先拼接初始链接,然后获取分页链接,之后再利用HtmlParser解析深层链接。在页面邮址提取阶段,则利用正则表达式匹配页面源码获取邮箱地址。

关 键 词:搜索引擎 邮址提取 HtmlParser框架 正则表达式 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象