检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]信息工程大学信息工程学院,河南郑州450002
出 处:《信息工程大学学报》2012年第4期496-502,共7页Journal of Information Engineering University
基 金:国家重点实验室开放课题资助项目(SKLSDE-2011KF-06)
摘 要:微博作为一种新的在线社会网形式,逐渐成为人们获取和共享信息的重要平台。以我国最大的微博网站——新浪微博为对象,重点研究了微博话题的流行度预测问题。收集了大约40G的微博话题信息作为研究数据集,从中提取出与话题流行度相关的微博用户属性和话题内容属性,在对这些属性相关性分析的基础上,提出了一种兼顾用户属性和内容属性的话题流行度定量描述方法。文章对影响话题流行度的各属性进行了详细的主成分分析,总结出4种属性作为话题流行度预测的依据,并建立了流行度的线性预测模型。该模型能较好地预测话题流行度,模型指标R2达到0.89。The two-year old Sina weibo is the most famous micro-blogging platform in China. The goal of this paper is to predict the popularity of a newly submitted tweet timely and accurately. By analyzing the correlations of each feature of the user and tweet content, a quantitative description of tweet' s popularity is presented. Principle components analysis is used to reduce the feature dimen- sions by performing a covariance analysis between factors that affect tweet' s popularity, and some most important features are extracted. Then, a PCA-based linear predicating model to predict the popularity of a newly submitted tweet is built. A validation is made on Sina micro-blogging network. The result shows that the model works well on predicting the popularity of a new tweet, and the eval-uation index R^2 reaches 0.89.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.128.205.101