基于领域知识和词向量的词义消歧方法  被引量:14

Word Sense Disambiguation Based on Domain Knowledge and Word Vector Model

在线阅读下载全文

作  者:杨安[1] 李素建[1,2] 李芸[3] 

机构地区:[1]北京大学计算语言学教育部重点实验室,北京100871 [2]语言能力协同创新中心,徐州221009 [3]中国社会科学院语言研究所,北京100732

出  处:《北京大学学报(自然科学版)》2017年第2期204-210,共7页Acta Scientiarum Naturalium Universitatis Pekinensis

基  金:国家自然科学基金(61273278;61572049)资助

摘  要:利用无标注文本构建词向量模型,结合特定领域的关键词信息,提出一种词义消歧方法。以环境领域的待消歧文本作为评测语料,通过与Lesk等其他消歧方法进行比较,证明了所提方法的有效性。通过引入不同的领域知识,证明该方法亦可在其他领域的文本消歧任务中加以应用。A WSD method is presented,using domain keywords and word vector model built from unlabelled data.The effectiveness of the proposed approach is proved,compared with other WSD methods including Lesk on evaluation corpus in environmental domain.Through employing knowledge from different fields,proposed method can be adapted into the WSD task of other domains.

关 键 词:词义消歧 词向量模型 领域知识 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象