检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]浙江理工大学,杭州310018
出 处:《电脑编程技巧与维护》2014年第15期22-25,共4页Computer Programming Skills & Maintenance
摘 要:在百度、谷歌等现有搜索引擎基础上,利用HtmlParser开源框架,用Java语言开发了一种基于搜索引擎关键字的邮址搜集软件。提取邮址的过程包括页面链接的获取和页面邮址的提取。在获取页面链接阶段,首先拼接初始链接,然后获取分页链接,之后再利用HtmlParser解析深层链接。在页面邮址提取阶段,则利用正则表达式匹配页面源码获取邮箱地址。
关 键 词:搜索引擎 邮址提取 HtmlParser框架 正则表达式
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28