一种基于时序主题模型的网络热点话题演化分析系统  被引量:23

Study on a Hot Topics Analysis System based on Time Sliced Topic Model

在线阅读下载全文

作  者:廖君华[1] 孙克迎[1] 钟丽霞[1] 

机构地区:[1]山东理工大学科技信息研究所

出  处:《图书情报工作》2013年第9期96-102,118,共8页Library and Information Service

基  金:山东理工大学2012年学生工作研究立项课题"新媒体时代大学生信息行为研究"研究成果之一

摘  要:设计基于网络数据的时序主题演化系统Hot Topics Analysis System(HTAS),实现网络热点话题数据源自动定制、自动获取和自动存储。针对中文话题分析,HTAS集成了Google的开源分词系统IKAnalyzer,批量处理中文文档。采用LDA模型对网络热点话题主题进行提取,并利用时间标签发现热点话题,通过图标形式可视化展示其演化规律。通过"钓鱼岛事件"的实验证明,HTAS系统能快速获取、存储网络热点话题,并能有效地分析其演化趋势。A Hot Topics Analysis System (HTAS) based on time sliced network data was proposed. HTAS realized the network hot topic data source automatically collected, acquisition and storage. HTAS integrated the google revenue segmentation system IKAnalyzer to batch processing of Chinese documents. HTAS used LDA model to extract and time label to find the evolution of the hot topics on the network. Experiments of Diaoyudao as the hot event show that, the system can effectively acquire, store and analyze this hot topic evolution trend.

关 键 词:主题模型 话题演化 热点话题 LDA 

分 类 号:G350[文化科学—情报学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象