检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学技术大学计算机科学与技术系,安徽合肥230027 [2]中国科学技术大学电子工程与信息科学系,安徽合肥230027
出 处:《中文信息学报》2003年第4期45-51,共7页Journal of Chinese Information Processing
基 金:国家自然科学基金资助 (6 9975 0 18)
摘 要:文本标准化是对输入文本进行分析 ,生成其中非汉字符号的拼音、节奏等信息的过程。本文提出了一种层次化的、基于外部规则的标准化方法 ,通过规则匹配识别这些符号 ,并给出各种正确信息。本文首先介绍了分析树的概念 ,其次给出构造规则的步骤 ,利用权值控制规则的匹配顺序 ,最后给出实验结果。实验结果表明 :这种方法具有很好的易维护性和可扩展性 ,开放测试的正确率达到 99 76 %。Text normalization is a procedure to generate information, such as pronunciation, rhythm and so on, for special symbols correctly. In this paper, a method based on hierarchical, external rules is presented. By matching rules, we can recognize normal special symbols and generate correct information. This paper introduces the concept of analysis tree firstly, then shows the steps of constructing rules and presents the experiment results. The results show that we can achieve easy-maintainability and easy-expandability, and the correct rate of open test is 99.76%.
关 键 词:中文语音合成系统 文本标准化 外部规则 权值控制规则 文语转换系统 特殊符号
分 类 号:TN912.33[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15