基于自适应聚类的虚假评论检测  被引量:33

Detection of fake reviews based on adaptive clustering

在线阅读下载全文

作  者:宋海霞[1] 严馨[1] 余正涛[1] 石林宾[1] 苏斐[2] 

机构地区:[1]昆明理工大学信息工程与自动化学院,昆明650500 [2]中国石油信息技术服务中心,北京100007

出  处:《南京大学学报(自然科学版)》2013年第4期433-438,共6页Journal of Nanjing University(Natural Science)

基  金:国家自然科学基金(61175068);云南省教育厅基金重大专项项目;教育部回国留学人员启动基金

摘  要:借助评论者的行为特性,提出一种基于评论者行为特征的自适应聚类的虚假评论检测方法.首先,根据评论数据定义自身基本特征以及与其他评论之间的关联性特征,并对每维特征进行归一化处理;其次,根据每一条评论的特征构建聚类矩阵,利用F统计量对K均值算法进行改进,实现评论数据的自适应聚类;最后,计算每个簇偏离整个评论数据集的程度,根据阈值确定异常簇,从而实现虚假评论检测.利用领域评论数据进行实验,结果表明基于自适应聚类的虚假评论检测方法取得了较好的效果.With the behavior characteristics of the reviewers,we propose one fake review detection method based on adaptive clustering from the behavior features of reviewers.Firstly,according to the reviewed data,we define the basic features and correlation features with other reviewers,and normalize the features of each dimension.Secondly,we build a clustering matrix based on the features of each review using F statistic to improve the K-means algorithm,and to achieve adaptive clustering for reviews.Finally,we calculate the degree of deviation from the entire review data set for each cluster,and determine abnormal clusters based on the threshold value to achieve fake review detection.Our experimental results show that it gets a better effect to use the method of fake reviews detection based on adaptive clustering using areas 'review data.

关 键 词:虚假评论 自适应聚类 异常簇 F统计量 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象