基于依存句法的中文语义模型及语义提取方法  

Chinese Semantic Model and Semantic Extraction Method Based on Dependency Syntax

在线阅读下载全文

作  者:王佳琦 韩军 孙启童 WANG Jiaqi;HAN Jun;SUN Qitong(State Key Laboratory of Software Development Environment,Beihang University,Beijing 100191,China)

机构地区:[1]北京航空航天大学软件开发环境国家重点实验室,北京100191

出  处:《中文信息学报》2023年第10期16-25,共10页Journal of Chinese Information Processing

摘  要:意图识别与槽填充是语义提取的常用方法,其存在如下两个问题:依赖训练数据,需要标注大量的数据用于训练模型;可迁移性差,训练得到的模型难以复用。针对上述问题,该文对于不同的语义提取场景,提出了四种不同的语义模型。同时,该文研究了汉语语法的特点,基于依存句法,提出了不同的语义提取算法,解决了模型难以复用的问题。该方法对数据集的要求较低,节省了成本。最后,设计了语义提取实验,验证了在样本规模小且分布不均匀的数据集下,语义提取算法相比于部分中文文本分类算法有更高的准确率。该文提出的模型和算法具有一般性,对于文本分类、人机对话等不同语义提取场景具有较强的指导意义。Intention recognition and slot filling are common tasks in semantic extraction,which rely on large amount of annotated training data.This paper proposes four different semantic models for different semantic extraction scenarios based on dependency syntax.This method requires less data set and saves cost.Experiments are designed to verify that the proposed methods achieve higher accuracy than some Chinese text classification algorithms in the case of small sample size and uneven distribution of data sets.

关 键 词:意图识别 依存句法 语义模型 语义提取 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象