检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]东华大学,上海201620
出 处:《科学技术与工程》2007年第24期6348-6352,共5页Science Technology and Engineering
摘 要:拼音到汉字转换一直是中文信息处理研究的一个重要方面。在前人的基础上改进了他们所使用的数据平滑算法,给出了两种应用于不同场合的公式,使得在结果中能够得到不同要求的解。同时,给出了利用隐马尔可夫模型(HMM)来设计实现这样一种转换,并且利用Viterbi算法来对模型进行求解的设计细节与方法。最后利用随意选择的语料库来对计算机进行训练学习并给出了测试结果,同时分析了错误结果的原因。The conversion of Pinyin into Chinese characters is an important aspect of Chinese mtormation processing. This paper gives improvement on cache-based natural language algorithms on the basis of predecessors, with two formulas applied to two different occasions to meet different requirements. Also it shows how to achieve such a conversion by using hidden Markov model (HMM) and Viterbi algorithm is used to solve the model. This article gives a detailed way about the design. At the end we randomly choose the corpus to train on the computer and give test results with the analysis of the wrong reasons.
关 键 词:拼音汉字转换 隐马尔可夫模型 VITERBI 语料库学习 数据平滑
分 类 号:TP391.12[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.31