基于Dropout正则化的汉语框架语义角色识别  被引量:16

Chinese FrameNet Semantic Role Identification Based on Dropout Regularization

在线阅读下载全文

作  者:王瑞波[1,2] 李济洪[1] 李国臣[3] 杨耀文[4] 

机构地区:[1]山西大学软件学院,山西太原030006 [2]山西大学计算机与信息技术学院,山西太原030006 [3]太原工业学院计算机科学系,山西太原030008 [4]山西大学数学科学学院,山西太原030006

出  处:《中文信息学报》2017年第1期147-154,共8页Journal of Chinese Information Processing

基  金:国家自然科学基金(NNSFC-61503228);NSFC-广东联合基金(第二期)

摘  要:汉语框架语义角色识别是汉语框架语义分析的重要任务之一。该文基于汉语词语、词性等特征的分布式表示,使用一种多特征融合的神经网络结构来构建汉语框架语义角色识别模型。鉴于可用的训练语料规模有限,该文采用了Dropout正则化技术来改进神经网络的训练过程。实验结果表明,Dropout正则化的加入有效地缓解了模型的过拟合现象,使得模型的F值有了近7%的提高。该文进一步优化了学习率以及分布式表示的初始值,最终的汉语框架语义角色识别的F值达到70.54%,较原有的最优结果提升2%左右。Semantic role identification is an important task for semantic parsing according to Chinese FrameNet. Based on distributed representations of Chinese words, the part of-speech and other symbolic features, we build our semantic role identification model by employing a kind of multi-feature integrated neural network architecture. Due to the relative small training corpus, we adopt the dropout regularization to improve quality of the training process. Experimental results indicate that, 1) dropout regularization can effectively alleviate over-fitting of our model, and 2) the F-measure increases upto 7%. With further optimization of the learning rate and the pre-trained word embeddings, the final F-measure of our semantic role identification model reaches 70.54 %, which is about 2% higher than the state-of-the-art result.

关 键 词:汉语框架网络 语义角色识别 Dropout正则化 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象