检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王博立 史晓东[1,2,3] 苏劲松[4]
机构地区:[1]厦门大学智能科学与技术系,厦门361005 [2]厦门大学两岸关系和平发展协同创新中心,厦门361005 [3]福建省类脑计算技术及应用重点实验室,厦门361005 [4]厦门大学软件学院,厦门361005
出 处:《北京大学学报(自然科学版)》2017年第2期255-261,共7页Acta Scientiarum Naturalium Universitatis Pekinensis
基 金:教育部专项"简繁汉字智能转换系统";教育部博士点基金(20130121110040);国家科技支撑计划项目(2012BAH14F03);国家自然科学基金(61573294);CCF中文信息技术开放课题(CCF2015-01-01)资助
摘 要:提出一种基于循环神经网络的古文自动断句方法。该方法采用基于GRU(gated recurrent unit)的双向循环神经网络进行古文断句。在解码过程中,该算法不仅利用神经网络输出的概率分布,还进一步引入状态转移概率和长度惩罚,以便提高断句准确率。在大规模古籍语料上的实验结果表明,所提方法能够取得比传统方法更高的断句F1值。This paper proposes an automatic sentence segmentation method for ancient Chinese texts based on recurrent neural network (RNN).A bi-directional RNN structure with gated recurrent units (GRU) is implemented,and state transition probability and length penalty are employed in decoding to improve the accuracy.Experimental results show that proposed model achieves higher F1 score than traditional methods.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28