检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]哈尔滨工业大学深圳研究生院计算机科学与技术学科部,广东深圳518055
出 处:《中文信息学报》2008年第5期51-55,共5页Journal of Chinese Information Processing
基 金:国家863专题目标导向类资助项目(2006AA01Z197);国家自然科学基金重点资助项目(60435020);国家自然科学基金面上资助项目(90612005)
摘 要:该文介绍了语句级汉字拼音输入技术评估方法的研究意义及其重要性。从信息论角度出发,提出了基于损失函数的语句级汉字拼音输入技术的评估方法,它通过损失函数比较经语句级汉字拼音输入系统输出的句子和相应的标准句子,得到描述系统性能的定量指标。该方法对汉字拼音输入技术的音节流自动切分和音字转换两方面进行了较全面的评估。采用手工标注的1996年《人民日报》部分语料,对目前流行的汉字拼音输入技术进行了评估,实验结果表明:拼音输入技术音字转换准确率最高能达到64.3%,音节流自动切分对音字转换的准确率有大约2%的影响。评估结果对今后的拼音输入技术的评估提供了参考价值,对汉字拼音输入技术的持续发展有指导意义。This paper introduces the significance of evaluation of Chinese sentential syllable input method system. An approach based on loss functions is proposed, which uses loss functions to evaluate the performance of syllable input method system by comparing the input sentences and standard sentences. This approach can evaluate syncopation of Chinese phonetic string and syllable-to-character conversion comprehensively which has been applied to popular systems using partial People's Daily in 1996. The experimental result shows that the best precise of syllable-to-character achieves 64.30% and it is affected by syncopation of Chinese phonetic string around 2%. The result plays an importance role in sustainable development of syllable input method.
关 键 词:人工智能 自然语言处理 语句级汉字拼音输入技术 损失函数 音节流自动切分 音字转换
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.221