基于支持向量机的越语新闻文本分类方法  被引量:3

Vietnamese News Text Classification Method Based on Support Vector Machine

在线阅读下载全文

作  者:潘华山[1] 严馨[1] 余正涛[1] 郭剑毅[1] 

机构地区:[1]昆明理工大学智能信息处理重点实验室,云南昆明650500

出  处:《山西大学学报(自然科学版)》2013年第4期505-509,共5页Journal of Shanxi University(Natural Science Edition)

基  金:国家自然科学基金(61262041)

摘  要:针对越语新闻文本自动分类问题,文章提出一种基于支持向量机的越语新闻文本分类方法.采用支持向量机学习算法,充分考虑文本中命名实体对越语新闻文本分类的特殊作用,分别在句法和语义层面选取词、词性和命名实体作为特征,构建新闻文本分类模型.越语新闻文本分类实验结果表明,提出方法取得了好的效果,命名实体要素对分类有非常好的支撑作用.For Vietnamese news automatic text classification problems, we propose a Vietnamese news text classification method based on Support Vector Machine, and build a news text classification model with Support Vector Machine learning algorithm,taking full account of the special role of named entities in text to Vietnamese news text classification,selecting word,part of speech and named entity as features on syn- tactic and semantic level. The experimental results show that the proposed method has achieved a good re- suit,and the named entity elements play a very good supporting role to the Vietnamese classification.

关 键 词:越语 文本分类 新闻文本 支持向量机 命名实体 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象