检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张晓孪 王西锋 ZHANG Xiaoluan;WANG Xifeng(School of Computer, Baoji University of Arts and Sciences, Baoji 721016)
机构地区:[1]宝鸡文理学院计算机学院
出 处:《微型电脑应用》2019年第6期69-70,77,共3页Microcomputer Applications
基 金:宝鸡文理学院校级一般项目(YK1617)
摘 要:随着互联网技术的应用,大量求职者期望能从招聘网站中快速、精准获取有用信息,因此分析并抽取这些网站中的招聘信息具有实际应用的价值.针对Web信息抽取技术在招聘信息系统中的应用,提出了一种基于语义的Web招聘信息抽取的方法,首先是构建主题蜘蛛程序抓取网页,然后对预处理过的网页中的命名实体进行识别.经测试采用本文提出的方法进行信息抽取是可行的,命名实体识别的准确率和召回率能达到71%以上.With the application of the Internet technology, a large number of job seekers expect to obtain useful information quickly and accurately from the recruitment Website. That the recruitment information extraction provides for the majority of job seekers correct employment information is of great importance. Aiming at the application of Web information extraction technology in recruitment information system, this paper proposes a Web recruitment information extraction method based on semantic. The first is to build a topic spider program to crawl the Web page, and then to identify named entity from pre-processed Web pages. After testing, it is feasible to use the method proposed in this paper to extract the information, and the accuracy and recall rate of named entity recognition are all above 71%.
关 键 词:语义 Web招聘信息抽取 蜘蛛程序 命名实体识别
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229