基于专家主页的专家信息抽取方法研究  

Study on Expert Information Extraction Method Based on Expert Homepage

在线阅读下载全文

作  者:曹洪飞 顾复[1] 张今[1] 陈芨熙[1] Cao Hongfei;Gu Fu;Zhang Jin;Chen Jixi(Department of Industry and System Engineering Zhejiang University,Hangzhou Zhejiang 310027)

机构地区:[1]浙江大学工业与系统工程系

出  处:《情报探索》2019年第12期1-9,共9页Information Research

基  金:国家重点研发计划课题“科技资源分享模型与开放分享理论”(项目编号:2017YFB1400302)研究成果之一

摘  要:[目的/意义]旨在为企业建立自己的专家信息库提供参考。[方法/过程]构建一个统一的专家信息元数据框架,对专家信息进行了规范化描述;对专家主页的网页标题、网页URL和网页内容等进行了分析,并从中提取特征进行专家主页的识别;构建一个自适应多种主页类型的Bi-LSTM-CRF专家信息抽取模型,并对模型性能进行了实验分析。[结果/结论]基于专家主页的专家信息抽取方法能够利用机器学习技术从海量的Web页面中有效识别专家主页,并且通过改进的信息抽取模型从专家主页中自动抽取企业所需要的专家信息。本文提出的方法是有效的。[Purpose/significance]The paper is to provide references for enterprises to establish their own expert information base.[Method/process]The paper builds a unified expert information metadata framework,describes the expert information in a standardized way;analyzes the title,URL and content of the expert homepage to extract features to identify the expert homepage;builds an adaptive expert information extraction model for various homepage types,and analyzes the model performance.[Result/conclusion]The expert information extraction method based on expert homepage proposed in this paper can use machine learning technology to effectively identify the expert homepage from a large number of web pages,and automatically extract expert information from the expert homepage through an improved information extraction model.The experimental results show that the proposed method is effective.

关 键 词:专家资源 元数据框架 专家主页识别 专家信息抽取 

分 类 号:G203[文化科学—传播学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象