检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南华大学计算机科学与技术学院,衡阳421000
出 处:《现代计算机(中旬刊)》2016年第5期52-55,共4页Modern Computer
基 金:湖南省哲学社会科学基金(No.14YBA335)
摘 要:提出一种通过提取词向量,并利用机器学习对新闻文本进行分类的方法。首先,通过对预先收集好的新闻语料进行分析,获取到词的向量表示形式;然后通过新闻中的一些关键词提取出新闻的关键句;最后把词向量和关键句当中的关键词词性作为组合特征,采用SVM算法进行分类,得到新闻的倾向性类别。实验表明,基于组合特征的SVM文本分类方法具有较高的F值。Proposes an approach for classifying the sentiment of news text based on SVM and Word Embedding.Firstly,word embedding is achieved by training the pre-collected news corpus with word2 vec.Secondly,key sentences are constructed from some key words in news text.At last,the word embedding and key words' part-of-speech are selected as combination features to apply in SVM algorithm,and then the sentiment classification of news text is obtained.Experimental results show that SVM based on combination features has high F value in sentiment classification.
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3