统计自然语言处理中的线性插值平滑技术  被引量:4

Linear Interpolated Methods in Statistical Natural Language Processing

在线阅读下载全文

作  者:张敬芝[1] 高强[1] 耿桦[1] 潘金贵[1] 

机构地区:[1]南京大学计算机软件新技术国家重点实验室,南京210093

出  处:《计算机科学》2007年第6期223-225,244,共4页Computer Science

摘  要:统计自然语言处理中,一个很复杂的问题是数据稀疏问题。主要有两种平滑方法解决:回退法和线性插值法。本文分析和比较了几种典型的线性插值方法,着重研究了它们所引发的词性聚类倾向。在此基础上,给出了2种改进的平滑方法。实验表明,改进的方法比原来的方法有更出色的平滑效果。One of the complicated problems in statistical natural language processing is the data-sparseness problem. There are mainly two kinds of smoothing technologies to solve it, backing-off models and linear interpolated models. This article compares several typical linear interpolated methods, and focuses on studying the relationship between the smoothing parameters and the parts of speech. Besides, two improved methods are proposed. Our experiment results show that both of them outperform original ones.

关 键 词:统计语言模型 数据稀疏问题 平滑技术 回退法 线性插值法 N-GRAM 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象