检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:邵艳秋[1] 韩纪庆[1] 刘挺[1] 赵永贞[1]
机构地区:[1]哈尔滨工业大学计算机学院,哈尔滨150001
出 处:《声学学报》2006年第3期203-210,共8页Acta Acustica
基 金:国家自然科学基金资助项目(60085001)
摘 要:重音是语音合成中韵律处理的一个重要参数。本文分析了轻声和重读音节同正常重音在各声学参数上的差异,包括基频、音节时长、强度、停顿长度等,还特别考察了时长同基频参数之间的关系,以及上声音调同基频的关系。建立了基于人工神经网络的三种重音预测模型,即声学预测模型、语言学预测模型和混合预测模型,对汉语句重音(包括轻声、正常重音、重读)进行了自动判别,结果显示混合模型要优于另外两种模型。此外,本文还根据重音标注的多样性现象设计了支持率的评价方法。Stress is an important parameter for prosody processing in speech synthesis. This paper compares the acoustic features of unstressed syllable and stressed syllables with normally stressed syllables, including pitch, syllable duration, intensity and pause length. The relations between duration and pitch, and Third Tone (T3) and pitch are also studied. Three stress prediction models based on ANN, i.e. acoustic model,linguistic model and mixed model, are proposed to predict Chinese sentential stress. The result shows that mixed model is better than the other two models. In order to solve the problem of the diversity of manual labeling, another valuation method of support ratio is proposed.
关 键 词:自动判别 自然风格 语句 预测模型 人工神经网络 声学参数 混合模型 语音合成 评价方法 基频
分 类 号:TN912.3[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30