基于主题的汉语语言模型的研究  被引量:4

Research on a Topic-Based Chinese Language Model

在线阅读下载全文

作  者:曲卫民[1] 张俊林[1] 孙乐[1] 

机构地区:[1]中国科学院软件研究所系统软件与中文信息中心,北京100080

出  处:《计算机研究与发展》2003年第9期1368-1374,共7页Journal of Computer Research and Development

基  金:国家自然科学基金 ( 60 2 0 3 0 0 7);国家"八六三"高技术研究发展计划重大项目基金 ( 2 0 0 1AA114 0 40 )

摘  要:基于主题的自适应语言模型能有效地解决语言模型跨主题应用的问题 ,针对其面临的两个主要问题———语料的分类和各语言模型的融合 ,采用了一种新的语料分类算法 ,突破了原有分类方法的一些局限性 ,并提出了一种改进的融合各语言模型的方法 :概率 +线性插值法 ,该方法既改善了语言模型的性能 。A topic based language model effectively solves the problem of cross domain application of a statistical language model There exist two questions, how to cluster the corpus to different topics and how to combine the topic specific language models First, a new method is adopted to cluster the corpus that has overcome some limitations of the old one Second, an improved algorithm is proposed to combine different language models Not only has the new method improved the performance, but also accelerated the model

关 键 词:语言模型 自适应 主题 分类 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象