结合语言模型的自动文本分类的应用研究  

Application Study of Automatic Text Classification Combined with Language Model

在线阅读下载全文

作  者:赵敏涯[1] 

机构地区:[1]苏州市职业大学计算机工程系,江苏苏州215104

出  处:《计算机与现代化》2010年第3期141-143,共3页Computer and Modernization

摘  要:研究统计语言模型中bigram模型在自动文本分类中的应用,针对传统的向量空间模型在计算文本相似度时假设特征项相互独立的缺点,提出一种利用词对及词序信息来改善文本分类结果的方法。实验结果表明该方法是可行且有效的。Tiffs paper studies the application of bigram model from statistical language model in the automatic text classification. Referring to the shortcoming of the hypothesis that the terms are independent from each other in VSM (Vector Space Model), it puts forward a method to improve the result of text classification with mutual words' information and sequence. The experiment shows that the method is feasible and efficient.

关 键 词:统计语言模型 文本分类 平滑 bigram 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象