基于网络爬虫的学生就业信息挖掘与推送研究  被引量:2

Research on Mining and Pushing of Students Employment Information Based on Web Crawler Application

在线阅读下载全文

作  者:陈康琛 刘进进 陈兴雷[1] CHEN Kang-chen;LIU Jin-jin;CHEN Xing-lei(Anhui University of Finance and Economics,Bengbu 233030,China)

机构地区:[1]安徽财经大学财政与公共管理学院

出  处:《电脑知识与技术》2019年第7期6-8,13,共4页Computer Knowledge and Technology

基  金:2018年国家级大学生创新训练计划支持项目“基于网络爬虫的大学生就业信息挖掘与推送系统研究”(项目编号:201810378250)

摘  要:为了解决大学生获取就业信息滞后、时间成本高昂以及与用人组织间信息不对称的问题,提出运用网络爬虫信息技术和邮件推送技术的设计思想,以自动化控制减少人工操作为实现途径,开发和研究学生就业信息挖掘与推送系统。系统包括输入加载模块,信息抓取模块,结果输出模块和邮件推送模块。以Python计算机设计语言为基础,进行代码编译,实现以全国大学生就业公共服务立体化平台(新职网)为自动爬取对象,对网站工作日当天信息JSON数据源下载存储,信息抓取模块与邮件推送模块相配合,在索引JSON数据库进行深度挖掘后,自动将输出汇总结果推送至邮箱。系统操作简单,高效可靠,在毕业季中有较大推广应用可能。In order to solve the problems of inadequate access to employment information,high time cost and asymmetric informa?tion between college students and employers,this paper puts forward the design idea of using web crawler information and email push technologies to develop and study a mining and pushing system of student employment information,so that the manual opera?tion can be reduced through an automatic control.The system includes input loading module,information capture module,result output module,and email push module.The code is compiled on the basis of Python computer design language.Taking NCSS(New Career Service Site for Students)as the automatic crawler object,it downloads and saves the daily information JSON data source from the website on workdays.Combined with information capture module and email push module,the output summary results can be automatically pushed to the mailbox after in-depth mining of index JSON database.The system is efficient,reliable and easy to use,which may be widely used in the graduation season.

关 键 词:PYTHON 网络爬虫 就业信息 邮件推送 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象