检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《中文信息学报》2001年第6期7-12,共6页Journal of Chinese Information Processing
基 金:国家"九八五"重大项目 (人机自然语言交互技术 ) (985校 22攻关0 6 )
摘 要:本文提出了一种基于词和词义混合的统计语言模型 ,研究了这个模型在词义标注和汉语普通话语音识别中的性能 ,并且与传统的词义模型和基于词的语言模型进行了对比。这个模型比传统词义模型更准确地描述了词义和词的关系 ,在词义标注中具有较小的混淆度 ;在汉语普通话连续音识别中 ,这个词义模型的性能优于基于词的三元文法模型 。A hybrid semantic and word based language model is brought forward in this paper.The performance of the model is tested in semantic tagging and Mandarin speech recognition,and compared with traditional N gram and semantic language models.The hybrid model better describes the relation between semantics and words and achieves a lower perplexity in tagging corpus.In Mandarin speech recognition,this model shows a better performance and requires less memory space than the word based trigram model.
关 键 词:统计语言模型 词义模型 词义标注 语音识别 混淆度 存储空间 混合模型
分 类 号:TP391.12[自动化与计算机技术—计算机应用技术] TN912.34[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.26