检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]哈尔滨工业大学计算机网络与信息安全技术研究中心,哈尔滨150001
出 处:《计算机工程》2014年第6期312-316,共5页Computer Engineering
基 金:国家"863"计划基金资助项目(2012AA012506;2011AA010705);国家自然科学基金资助项目(61173145);国家"973"计划基金资助项目(2011CB302605);国家科技支撑计划基金资助项目(2012BAH37B01)
摘 要:针对网络论坛热点话题的识别、发现和舆情监测问题,提出一种基于热度熵值的热点话题发现方法。通过网络爬虫抓取网络论坛中的数据,在对数据进行预处理和分析热点话题属性特征的基础上,合理定义各属性的权重和话题的热度熵值,并以此对话题的热点信息进行分析、统计与评估,从而发现和追踪网络论坛中的热点话题。同时,对话题的热度进行细致划分和各种类型的定义,采用不同阈值策略计算不同类型的热度信息标注的准确率。实验结果表明,该方法合理、有效,相比于传统的话题语义分析方法具有较高的准确率,可作为互联网论坛舆情监测的依据。Aiming at the problem of the identification, discovery and monitoring of public opinion of hot topic in network forums, a discovery method is presented based on the hot topic of the heat entropy. Firstly, it gets the data in the online forum with web crawler and reasonably defines the heat entropy of topic and the weight of each attribute on the basis of the data pre-processing and analysis of hot topics attributes. Secondly, it detects and tracks a hot topic in online forums according to the information about the analysis, statistics and evaluation of the hot topic. Finally, it calculates the accuracy of the different types with the topic of division and various types of definitions. Experimental results show that the policy is reasonable and effective compared with the traditional topic semantic analysis methods, so it can be the basis of the Internet forum of public opinion monitoring.
关 键 词:网络论坛 话题发现 属性特征 热度熵值 热点话题追踪 舆情监测
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.46