检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院网络数据科学与技术重点实验室(中国科学院计算技术研究所),北京100190 [2]中国科学院大学,北京100049
出 处:《计算机研究与发展》2016年第11期2630-2644,共15页Journal of Computer Research and Development
基 金:国家重点研发计划项目(2016YFB0800403);国家"九七三"重点基础研究发展计划基金项目(2014CB340406;2013CB329602);国家"八六三"高技术研究发展计划基金项目(2015AA015803);国家自然科学基金重点项目(61232010);国家自然科学基金面上项目(61173064);国家科技支撑计划基金项目(2015BAK20B03);山东省自主创新及成果转化专项(2014CGZH1103)~~
摘 要:社会网络是现代信息社会重要的组成部分.社会网络用户身份不透明、不可见的特性带来一系列社会安全问题.提出了一种社会网络身份特征识别方法,分别利用基于位置的社会网络和社交关系进行社会网络用户的身份特征识别,融合2种识别结果推测社会网络用户真实身份.提出了一种基于位置的社会网络用户身份识别方法,通过计算中文分词和二元组分词的基本匹配权重和完全匹配权重得到近似度权重,并用它衡量实体为用户所属实体的可能性;通过实体名称聚合算法,对近似度权重计算结果进行优化.根据好友之间倾向于拥有相似的身份特征和相同的兴趣爱好的观察,提出了一种基于社交关系的多数投票的身份识别方法,对社交关系中的用户身份特征进行统计,推测当前用户的地址信息、实体信息和用户兴趣.基于微博数据,进行了样本数为1 000名用户和10 000名用户的2组实验,涵盖了超过250万条社交关系.实验结果表明,提出的虚实映射方法有很高的准确率和覆盖率,与现有方法相比,该方法着眼于推测个人用户细粒度的身份特征,具有较高的实际应用价值.Social network is an important part of modern information society.The anonymity of social network users brings a series of problems concerning social security.This paper presents a method to recognize social network user identity feature by location-based social network(LBSN)and social relationships,and combine the results of those two to infer social network user true identity.The method of geo-location uses approximation weight which is calculated by computing full match weight and basic match weight based on Chinese segmentation and bi-word segmentation to evaluate the possibility that the entity is where the user studies or works,and the method uses entity name aggregation algorithm to optimize the result of approximation weight calculation.According to the observation that friend relationship between users on social network tends to indicate a certain same identity features or a share of common interests,the method of social relationships uses majority voting scheme to count user's friends identity features to infer user address,entity information and interests.Based on microblog data,we conduct experiments on two samples which cover 1 000 users and 10 000 users respectively and involve a total of more than 2.5million users relationships.Results shows that our method has a high rate of precision and recall.Compared with the existing methods,our method focuses on individual user identity feature and is valuable in practice.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28