检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:崔颖安[1,2,3] 李雪[4] 王志晓[1,2] 张德运[1]
机构地区:[1]西安交通大学电信学院,西安710049 [2]西安理工大学计算机科学与工程学院,西安710048 [3]网络计算与安全技术陕西省重点实验室(西安理工大学),西安710048 [4]陕西师范大学国际商学院,西安710062
出 处:《计算机学报》2014年第8期1859-1876,共18页Chinese Journal of Computers
基 金:教育部中央高校基金"在线社会化营销口碑群体发现"(13SZYB01);陕西省社科联重大理论与现实问题研究项目"陕西休闲农业的在线社会化媒体营销机制研究"(2013C124);中国电信"社会化媒体大数据云服务商业模式的研究"(SN2012-YS-13709);教育部人文社会科学研究项目"在线社交媒体大数据抽样方法的研究"(14XJC910002)资助
摘 要:社交媒体数据是行动者自组织关系的集合,其内部蕴含了多层次的社会实体关系,传统的抽样方法难以处理其内生的复杂性、不确定性以及涌现性,因此社交媒体抽样方法的研究对于社会计算这一新兴研究领域具有重要的研究价值和实践意义.文中首先按照社交媒体抽样技术发展的演进轨迹,对广度优先抽样法、点-边抽样法、用户均匀抽样法、同伴推动抽样法以及随机行走抽样法的基本思想、概率化控制能力、应用效果进行了全面的分析和比较,介绍了各类方法的特点与不足.其次根据领域问题研究的需要,使用社交媒体数据对上述方法进行了实际测试.测试结果表明现有抽样方法在微观层次(节点)和中观层次(子群)通过有效的节点规模扩张和概率控制,能够满足节点异质性与子群内聚性抽样的要求,但在宏观层次上却无法准确刻画由于局部凝聚子群再组织所表现出的涌现性.最后以此为依据,指出社交媒体数据抽样未来需要进一步深入研究的问题.This paper provides an overview and information useful for the sampling of online social media.The collections of actors' self organized relations constitute the data of online social media that contain multi level social relations.The traditional sampling methods are difficult to deal with their endogenous complexity,uncertainty and the whole emergence.So,the sampling method of online social media is significance and importance for the social computing,which is an emerging field in recent years.In accordance with the evolution of technology trajectory on the sampling of online social media,this paper introduces the characteristics and shortcomings of these methods,such as the Breadth First Search sampling,the "Node edge" sampling,the Uniform sampling of UserIDs,the Respondent Driven Sampling and the Random Walk sampling based on its thinking,probabilistic control,and the results of application with a comprehensive analysis,which uses the microblog data for the actual test based on the needs of the field.The research results show that the existing sampling methods at the micro level (nodes) and meso level (subgroup) simply by node expansion and the probability of effective control to meet the node heterogeneity and organizational subgroups sampling requirements,but at the macro level,the local cohesion of subgroups and their organization of emergent properties cannot portrayed accurately.At last,this paper pointed out the future research directions of the online social media sampling.
关 键 词:在线社交媒体 社会计算 社交网络 抽样技术 马尔科夫随机行走 抽样评价
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222