面向情感聚类的文本相似度计算方法研究  被引量:8

Text Similarity Calculation for Text Sentiment Clustering

在线阅读下载全文

作  者:李欣 李旸[2] 王素格[2,3] LI Xin;LI Yang;WANG Suge(Information Center,Shanxi Medical College for Continuing Education,Jinzhong,Shanxi 030619,China;School of Computer and Information Technology,Shanxi University,Taiyuan,Shanxi 030006,China;Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education Shanxi University,Taiyuan,Shanxi 030006,China)

机构地区:[1]山西职工医学院信息中心,山西晋中030619 [2]山西大学计算机与信息技术学院,山西太原030006 [3]山西大学计算智能与中文信息处理教育部重点实验室,山西太原030006

出  处:《中文信息学报》2018年第5期97-104,共8页Journal of Chinese Information Processing

基  金:国家自然科学基金(61573231;61632011;61672331;61432011);山西省科技基础条件平台计划项目(2015091001-0102)

摘  要:在文本情感分析时,使用无监督的聚类方法,可以有效节省人力和数据资源,但同时也面临聚类精度不高的问题。相似性是文本聚类的主要依据,该文从文本相似度计算的角度,针对情感聚类中文本—特征向量的高维和稀疏问题,以及对评论文本潜在情感因素的表示问题,提出一种基于子空间的文本语义相似度计算方法(RESS)。实验结果表明,基于RESS的文本相似度计算方法,有效解决了文本向量的高维问题,更好地表达了文本间情感相似性,并获得较好的聚类结果。In text sentiment analysis,unsupervised clustering method is challenged by low precision.To improve the text similarity measure lying as key to clustering,this paper proposes a semantic subspace(RESS)method to deal with the high dimension and sparseness of sentiment text representation issue.It also helps to caputure the implicit expression of sentiment.The experimental results show that RESS can effectively reduce the feature of data set and generat better results.

关 键 词:文本情感聚类 文本相似度计算 文本语义子空间 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象