检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:潘华山[1] 严馨[1] 余正涛[1] 郭剑毅[1]
机构地区:[1]昆明理工大学智能信息处理重点实验室,云南昆明650500
出 处:《山西大学学报(自然科学版)》2013年第4期505-509,共5页Journal of Shanxi University(Natural Science Edition)
基 金:国家自然科学基金(61262041)
摘 要:针对越语新闻文本自动分类问题,文章提出一种基于支持向量机的越语新闻文本分类方法.采用支持向量机学习算法,充分考虑文本中命名实体对越语新闻文本分类的特殊作用,分别在句法和语义层面选取词、词性和命名实体作为特征,构建新闻文本分类模型.越语新闻文本分类实验结果表明,提出方法取得了好的效果,命名实体要素对分类有非常好的支撑作用.For Vietnamese news automatic text classification problems, we propose a Vietnamese news text classification method based on Support Vector Machine, and build a news text classification model with Support Vector Machine learning algorithm,taking full account of the special role of named entities in text to Vietnamese news text classification,selecting word,part of speech and named entity as features on syn- tactic and semantic level. The experimental results show that the proposed method has achieved a good re- suit,and the named entity elements play a very good supporting role to the Vietnamese classification.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15