检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:孙宝山[1] 李玮 SUN Baoshan;LI Wei(College of Computer Science and software,Tianjin Polytechnic University,Tianjin 300387,China)
机构地区:[1]天津工业大学计算机科学与软件学院
出 处:《计算机工程与应用》2019年第19期160-165,共6页Computer Engineering and Applications
基 金:国家自然科学基金(No.51378350);天津市科技发展战略计划(No.17ZLZXZF00160)
摘 要:长短期记忆网络(LSTM)可以捕捉潜在的长距离依赖关系,已被广泛应用于中文分词模型。为进一步提高其分词效果,针对记忆单元因结构问题在处理序列时错误遗忘关键信息的情况,引入了窥视孔连接(peepholes)重新构建分词模型。为优化长距离依赖,使用了梯度截断、引导信息流正则化等手段。通过构建多种网络结构的分词模型在当下流行数据集上的分词实验,以此构建的双向循环网络结果表明:窥视孔连接的记忆单元比原记忆单元更有效的获取了待分类字符的上下文特征,有效地改善了LSTM部分信息缺失的情况,增强了网络的记忆能力,提高了模型分词性能。Long Short-Term Memory network(LSTM)can capture potential long- distance dependencies and has been widely used in Chinese word segmentation models.In order to further improve the effect,the word segmentation model is rebuilt by peepholes(peephole connection)in the case of error forgetting the key information in the processing sequence because of the structure problem in the memory unit.To optimize long distance dependencies,gradient truncation and guided information flow regularization are used.Through the construction of word segmentation experiments on current popular data sets,the results show that the memory unit of the peephole connection is more effective than the original memory unit to obtain the contextual features of the characters to be classified,effectively improving the missing information of the LSTM part and enhancing the memory ability of the network.The performance of the model word segmentation is higher.
关 键 词:长短期记忆网络 序列标注 窥视孔连接 长距离依赖 梯度截断 中文分词
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.227