基于频繁模式挖掘的网络舆情热点发现技术研究  被引量:6

Research of Network Public Opinion Hotspots Detection Based on Frequent Items Mining

在线阅读下载全文

作  者:王猛[1] 李斌[1] 孙春奇[1] 

机构地区:[1]哈尔滨工业大学网络与信息安全研究中心,哈尔滨150001

出  处:《微计算机信息》2010年第36期35-37,共3页Control & Automation

基  金:基金申请人:李斌;项目名称:网络危机响应系统关键技术研究;基金颁发部门:中华人民共和国工业和信息化部(2007A47)

摘  要:舆情热点发现是网络舆情系统的基本问题。通过分析传统舆情热点发现技术实时性和精准性差、算法复杂度高等问题,本文提出了基于频繁模式挖掘的网络舆情热点发现技术。基于网络数据流分布符合细尾特征,设计了一种高效的数据流频繁模式挖掘算法ILC,该算法使用差量窗口裁剪策略将每个数据项的处理时间降到了常数级别。对使用ILC算法的网络舆情热点发现技术进行实验,实验结果表明,该技术能够在高速的网络流量中实时精准地识别出舆情热点话题,正确率在90%以上。Network public opinion hotspots detection is a basic problem of network public opinion system. Traditional detection technology can't find hotspots instantly and usually cost too much. We found that data distribution meets small tails property,so proposed an effective data stream frequent items mining algorithm,ILC,using differ window prune strategy,reduce time cost to O (1). Using it,public opinion hotspots can be found out on web data stream. Experimental results show that this method can detect 90% network public opinion hotspots from high speed network stream instantly and accurately.

关 键 词:网络舆情 舆情热点发现 频繁模式挖掘 窗口裁剪 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象