基于SVM的中文微博观点句识别算法  被引量:7

The SVM-Based Algorithm for Chinese Micro-Blog Opinion Sentence Identification

在线阅读下载全文

作  者:杜锐[1] 朱艳辉[1] 鲁琳[1] 王文华[1] 邓程[1] 喻魁兰[1] 

机构地区:[1]湖南工业大学计算机与通信学院,湖南株洲412007

出  处:《湖南工业大学学报》2013年第2期89-93,共5页Journal of Hunan University of Technology

基  金:国家自然科学基金资助项目(61170102);湖南省自然科学基金资助项目(10JJ3002);国家社会科学基金资助项目(12BYY045);教育部人文社会科学研究青年基金资助项目(09YJCZH019);中国包装总公司科研基金资助项目(2008-XK13)

摘  要:针对中文微博中的海量文本,提出了利用领域观点词词典和支持向量机的方法对中文微博中的观点句进行识别。构建领域观点词词典,统计了表示中文微博观点句的5个特征,选取特征1,2,3,4进行观点句识别,并将基于支持向量机的3种不同特征组合识别算法与基于领域观点词词典的识别算法进行对比。算法对比结果表明,基于支持向量机的算法对微博观点句的识别效果较好,准确率68.75%,召回率48.71%,F值57.02%。For the mass texts in the micro-blog, uses the dictionary of opinion words and the method of support vector machine (SVM) to recognize the opinion sentence in Chinese micro-biog. Constructs the dictionary of opinion words, counts five features of Chinese micro-blog opinion sentences, selects four features to recognize opinion sentences, as well as compares the SVM-based algorithm and the algorithm of opinion words dictionary. The contrast results show that the SVM-based method is best in identifying the micro-blog opinion sentence, and the accuracy is 68.75 %, the recall rate is 48.71% and the F-measure is 57.02 %.

关 键 词:中文微博 支持向量机 观点句 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象