一种词义与词的混合语言模型及其应用  

A Hybrid Semantic and Word Based Language Model and Its Applications

在线阅读下载全文

作  者:侯珺[1] 王作英[1] 

机构地区:[1]清华大学电子工程系,北京100084

出  处:《中文信息学报》2001年第6期7-12,共6页Journal of Chinese Information Processing

基  金:国家"九八五"重大项目 (人机自然语言交互技术 ) (985校 22攻关0 6 )

摘  要:本文提出了一种基于词和词义混合的统计语言模型 ,研究了这个模型在词义标注和汉语普通话语音识别中的性能 ,并且与传统的词义模型和基于词的语言模型进行了对比。这个模型比传统词义模型更准确地描述了词义和词的关系 ,在词义标注中具有较小的混淆度 ;在汉语普通话连续音识别中 ,这个词义模型的性能优于基于词的三元文法模型 。A hybrid semantic and word based language model is brought forward in this paper.The performance of the model is tested in semantic tagging and Mandarin speech recognition,and compared with traditional N gram and semantic language models.The hybrid model better describes the relation between semantics and words and achieves a lower perplexity in tagging corpus.In Mandarin speech recognition,this model shows a better performance and requires less memory space than the word based trigram model.

关 键 词:统计语言模型 词义模型 词义标注 语音识别 混淆度 存储空间 混合模型 

分 类 号:TP391.12[自动化与计算机技术—计算机应用技术] TN912.34[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象