检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:佘琪星 王必聪 刘铭[1,2] 秦兵 王莉峰[3] SHE Qixing;WANG Bicong;LIU Ming;QIN Bing;WANG Lifeng(Research Center for Social Computing and Information Retrieval,Harbin Institute of Technology,Harbin,Heilongjiang 150001,China;Peng Cheng Laboratory,Shenzhen,Guangdong 518055,China;Tencent Technology(Shenzhen)Co.,Ltd,Shenzhen,Guangdong 518000,China)
机构地区:[1]哈尔滨工业大学,社会计算与信息检索研究中心,黑龙江哈尔滨150001 [2]鹏程实验室,广东深圳518055 [3]腾讯科技(深圳)有限公司,广东深圳518000
出 处:《中文信息学报》2020年第10期27-32,共6页Journal of Chinese Information Processing
基 金:国家自然科学基金(61772156,61976073);黑龙江省自然科学基金(F2018013)。
摘 要:同义词挖掘是自然语言处理领域中的一个基础任务,而同义词对的判别是该任务的一个重要部分。传统两大类方法,基于分布式表示和基于模板的方法,分别利用了语料的全局统计信息和局部统计信息,只能在精确率和召回率中权衡。随着预训练词向量技术的发展,基于分布式表示的方法存在一种简单高效的方案,即直接对预训练好的词向量计算相似度,将此表示为语义相似度。然而,这样的思路并没有利用到现有的同义词对这一外部知识。该文提出基于《同义词词林》的词向量微调方法,利用同义词对信息,增强预训练词向量的语义表示。经过实验,该微调方法能很好地完成同义词对的判别。Synonym discovery is a typical task in natural language processing,aiming at predicting whether a given word is a synonym of another word.With pre-trained word embedding appeared recently,a simple and effective distributional based approach is available by exploiting the similarity between word embeddings.To further augmenting external knowledge such as synonym tuples,this paper proposes a word embedding fine-tuning approach based on synonym tuples in Tongyi Cilin,so as to enhance the semantic representation of embedding.Our experiments show this approach is effective for predicting synonyms.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.33