语句级汉字拼音输入技术评估方法的研究  被引量:3

A Study on Chinese Sentential Pinyin Input Method Evaluation

在线阅读下载全文

作  者:汤步洲[1] 王晓龙[1] 王轩[1] 张强[1] 

机构地区:[1]哈尔滨工业大学深圳研究生院计算机科学与技术学科部,广东深圳518055

出  处:《中文信息学报》2008年第5期51-55,共5页Journal of Chinese Information Processing

基  金:国家863专题目标导向类资助项目(2006AA01Z197);国家自然科学基金重点资助项目(60435020);国家自然科学基金面上资助项目(90612005)

摘  要:该文介绍了语句级汉字拼音输入技术评估方法的研究意义及其重要性。从信息论角度出发,提出了基于损失函数的语句级汉字拼音输入技术的评估方法,它通过损失函数比较经语句级汉字拼音输入系统输出的句子和相应的标准句子,得到描述系统性能的定量指标。该方法对汉字拼音输入技术的音节流自动切分和音字转换两方面进行了较全面的评估。采用手工标注的1996年《人民日报》部分语料,对目前流行的汉字拼音输入技术进行了评估,实验结果表明:拼音输入技术音字转换准确率最高能达到64.3%,音节流自动切分对音字转换的准确率有大约2%的影响。评估结果对今后的拼音输入技术的评估提供了参考价值,对汉字拼音输入技术的持续发展有指导意义。This paper introduces the significance of evaluation of Chinese sentential syllable input method system. An approach based on loss functions is proposed, which uses loss functions to evaluate the performance of syllable input method system by comparing the input sentences and standard sentences. This approach can evaluate syncopation of Chinese phonetic string and syllable-to-character conversion comprehensively which has been applied to popular systems using partial People's Daily in 1996. The experimental result shows that the best precise of syllable-to-character achieves 64.30% and it is affected by syncopation of Chinese phonetic string around 2%. The result plays an importance role in sustainable development of syllable input method.

关 键 词:人工智能 自然语言处理 语句级汉字拼音输入技术 损失函数 音节流自动切分 音字转换 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象