基于非完备信息系统的评价对象情感聚类  被引量:2

Sentiment Clustering of Evaluation Object Based on Incomplete Information Systems

在线阅读下载全文

作  者:王素格[1,2] 尹学倩[3] 李茹[1,2] 张杰[3] 吕云云[1] 

机构地区:[1]山西大学计算机与信息技术学院,山西太原030006 [2]山西大学计算智能与中文信息处理教育部重点实验室,山西太原030006 [3]山西大学数学科学学院,山西太原030006

出  处:《中文信息学报》2012年第4期98-102,108,共6页Journal of Chinese Information Processing

基  金:国家自然科学基金资助项目(61175067;60970014;60875040);山西省自然科学基金资助项目(2010011021-1);山西省科技攻关项目(20110321027-02);教育部高等学校博士点基金项目(200801080006)

摘  要:该文利用领域本体对产品评论文本中的评价对象进行抽取和整合,在此基础上,建立产品性能的非完备信息系统,将特征的情感倾向寓于特征的权重计算之中。对非完备信息系统,给出了基于差别矩阵的启发式特征约简方法,通过特征降维处理,达到了减少特征的冗余度和数据稀疏性的目的。对降维后的非完备信息系统采用K-Means聚类算法,实现了评价对象情感聚类。为了验证该文提出方法的有效性,在真实汽车评论文本数据上进行实验,实验结果表明,在对特征进行一定程度的降维后,仍表现出较好的聚类效果。Based on the evaluation objects extraction form product review texts via the domain ontology,an incomplete information system for the product performance is established,which deals with the feature sentiment orientation by the feature weighting.A heuristic feature dimension reduction method is proposed based on discernibility matrix to reduce redundancy and data sparsity.K-Means clustering algorithm is utilized for realizing evaluation objects clustering.On the car review corpus,the proposed method produces the best performance after feature dimension reduction in a certainty extent in terms of the sentiment clustering of the evaluation objects.

关 键 词:非完备信息系统 评价对象 本体 特征降维 聚类 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象