检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:高毅[1] GAO Yi(Shanxi Vocational and Technical College of National Defense Industry,Xi'an 710300,China)
机构地区:[1]陕西国防工业职业技术学院
出 处:《自动化与仪器仪表》2020年第2期128-131,共4页Automation & Instrumentation
摘 要:在自然语言处理领域,分词是非拉丁语系语言处理的首要任务。而在中文自然语言处理中,常见的是针对现代汉语进行分词处理,对古汉语涉及得较少。针对这一问题,设计针对古汉语的分词系统。系统采用流行的深度学习方法,对中文首先进行分词,采用长短时神经网络LSTM提取序列特征;之后采用Softmax进行分类,设计针对古汉语分词的长短时神经网络。在测试中取得了理想的预期,基本可以满足设计需求。该系统一方面提高了教学的效率,降低了古汉语断句的难点;另一方面,在一定程度上提升了学习的兴趣。In the field of natural language processing,participles are the primary task of non-Latin language processing.In Chinese natural language processing,it is common to classify words for modem Chinese,and there are very few related to ancient Chinese.In response to this problem,the word segmentation system is designed for ancient Chinese.The popular deep learning method is used in the system which firstly cut sentence and then feed the sequence to LSTM to design long and short time neural networks for ancient Chinese word segmentation.It meet the design requirements.On the one hand,it improved the efficiency of teaching,lowered the difficulty of the sentence in ancient Chinese,and on the other hand,the interest of learning is raised at certain extent.
关 键 词:自然语言处理 深度学习 中文分词 长短时神经网络
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249