窥视孔连接的循环网络在中文分词上的研究  被引量:1

Recurrent Neural Network for Chinese Word Segmentation with Peephole-Connections

在线阅读下载全文

作  者:孙宝山[1] 李玮 SUN Baoshan;LI Wei(College of Computer Science and software,Tianjin Polytechnic University,Tianjin 300387,China)

机构地区:[1]天津工业大学计算机科学与软件学院

出  处:《计算机工程与应用》2019年第19期160-165,共6页Computer Engineering and Applications

基  金:国家自然科学基金(No.51378350);天津市科技发展战略计划(No.17ZLZXZF00160)

摘  要:长短期记忆网络(LSTM)可以捕捉潜在的长距离依赖关系,已被广泛应用于中文分词模型。为进一步提高其分词效果,针对记忆单元因结构问题在处理序列时错误遗忘关键信息的情况,引入了窥视孔连接(peepholes)重新构建分词模型。为优化长距离依赖,使用了梯度截断、引导信息流正则化等手段。通过构建多种网络结构的分词模型在当下流行数据集上的分词实验,以此构建的双向循环网络结果表明:窥视孔连接的记忆单元比原记忆单元更有效的获取了待分类字符的上下文特征,有效地改善了LSTM部分信息缺失的情况,增强了网络的记忆能力,提高了模型分词性能。Long Short-Term Memory network(LSTM)can capture potential long- distance dependencies and has been widely used in Chinese word segmentation models.In order to further improve the effect,the word segmentation model is rebuilt by peepholes(peephole connection)in the case of error forgetting the key information in the processing sequence because of the structure problem in the memory unit.To optimize long distance dependencies,gradient truncation and guided information flow regularization are used.Through the construction of word segmentation experiments on current popular data sets,the results show that the memory unit of the peephole connection is more effective than the original memory unit to obtain the contextual features of the characters to be classified,effectively improving the missing information of the LSTM part and enhancing the memory ability of the network.The performance of the model word segmentation is higher.

关 键 词:长短期记忆网络 序列标注 窥视孔连接 长距离依赖 梯度截断 中文分词 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象