检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:宋海霞[1] 严馨[1] 余正涛[1] 石林宾[1] 苏斐[2]
机构地区:[1]昆明理工大学信息工程与自动化学院,昆明650500 [2]中国石油信息技术服务中心,北京100007
出 处:《南京大学学报(自然科学版)》2013年第4期433-438,共6页Journal of Nanjing University(Natural Science)
基 金:国家自然科学基金(61175068);云南省教育厅基金重大专项项目;教育部回国留学人员启动基金
摘 要:借助评论者的行为特性,提出一种基于评论者行为特征的自适应聚类的虚假评论检测方法.首先,根据评论数据定义自身基本特征以及与其他评论之间的关联性特征,并对每维特征进行归一化处理;其次,根据每一条评论的特征构建聚类矩阵,利用F统计量对K均值算法进行改进,实现评论数据的自适应聚类;最后,计算每个簇偏离整个评论数据集的程度,根据阈值确定异常簇,从而实现虚假评论检测.利用领域评论数据进行实验,结果表明基于自适应聚类的虚假评论检测方法取得了较好的效果.With the behavior characteristics of the reviewers,we propose one fake review detection method based on adaptive clustering from the behavior features of reviewers.Firstly,according to the reviewed data,we define the basic features and correlation features with other reviewers,and normalize the features of each dimension.Secondly,we build a clustering matrix based on the features of each review using F statistic to improve the K-means algorithm,and to achieve adaptive clustering for reviews.Finally,we calculate the degree of deviation from the entire review data set for each cluster,and determine abnormal clusters based on the threshold value to achieve fake review detection.Our experimental results show that it gets a better effect to use the method of fake reviews detection based on adaptive clustering using areas 'review data.
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.143