检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:曹洪飞 顾复[1] 张今[1] 陈芨熙[1] Cao Hongfei;Gu Fu;Zhang Jin;Chen Jixi(Department of Industry and System Engineering Zhejiang University,Hangzhou Zhejiang 310027)
机构地区:[1]浙江大学工业与系统工程系
出 处:《情报探索》2019年第12期1-9,共9页Information Research
基 金:国家重点研发计划课题“科技资源分享模型与开放分享理论”(项目编号:2017YFB1400302)研究成果之一
摘 要:[目的/意义]旨在为企业建立自己的专家信息库提供参考。[方法/过程]构建一个统一的专家信息元数据框架,对专家信息进行了规范化描述;对专家主页的网页标题、网页URL和网页内容等进行了分析,并从中提取特征进行专家主页的识别;构建一个自适应多种主页类型的Bi-LSTM-CRF专家信息抽取模型,并对模型性能进行了实验分析。[结果/结论]基于专家主页的专家信息抽取方法能够利用机器学习技术从海量的Web页面中有效识别专家主页,并且通过改进的信息抽取模型从专家主页中自动抽取企业所需要的专家信息。本文提出的方法是有效的。[Purpose/significance]The paper is to provide references for enterprises to establish their own expert information base.[Method/process]The paper builds a unified expert information metadata framework,describes the expert information in a standardized way;analyzes the title,URL and content of the expert homepage to extract features to identify the expert homepage;builds an adaptive expert information extraction model for various homepage types,and analyzes the model performance.[Result/conclusion]The expert information extraction method based on expert homepage proposed in this paper can use machine learning technology to effectively identify the expert homepage from a large number of web pages,and automatically extract expert information from the expert homepage through an improved information extraction model.The experimental results show that the proposed method is effective.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15