大规模中文具体度词典的构建及推理技术  

Construction and Inference Technique of Large-Scale Chinese Concreteness Lexicon

在线阅读下载全文

作  者:谢志鹏[1] 毕冉 XIE Zhipeng;BI Ran(School of Computer Science,Fudan University,Shanghai 200433)

机构地区:[1]复旦大学计算机科学技术学院,上海200433

出  处:《北京大学学报(自然科学版)》2022年第1期1-6,共6页Acta Scientiarum Naturalium Universitatis Pekinensis

基  金:国家重点研发计划(2018YFB1005100);国家自然科学基金(62076072)资助。

摘  要:针对中文词语具体度资源的匮乏,提出一种自动的中文词语具体度词典构造方法。该方法充分利用已有的英文词语具体度资源,基于在线翻译工具和预训练词向量,训练出中文词语具体度的多层感知器回归模型,构造大规模的中文词语具体度词典。为了评估该中文词语具体度词典的性能,设计两项基本的具体度推理任务:词语级具体度推理和句子级具体度推理,并通过人工标注的方式构造相应的评测数据集。实验结果表明构造的词语具体度词典可以有效地完成这两项推理任务。To solve the resource-lack problem of Chinese word concreteness,this paper designs and implements an automatic method to construct Chinese concreteness lexicon.By making full use of the existing resource of English word concreteness,it builds up a large-scale Chinese concreteness lexicon based on pretrained word embeddings and an MLP concreteness regression model.In addition,it proposes the concreteness inference tasks on the word level and on the sentence level,and manually constructs the corresponding datasets for evaluation the performance of the Chinese concreteness lexicon on these tasks.Experimental results show that the constructed concreteness lexicon can perform the two inference tasks effectively.

关 键 词:词语具体度 具体度推理 多层感知器 自然语言处理 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] H164[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象