时序化LDA的舆情文本动态主题提取  被引量:3

Time Constrained LDA for Topic Extraction of Public Opinion Texts

在线阅读下载全文

作  者:万红新[1] 彭云[2] 郑睿颖[1] 

机构地区:[1]江西科技师范大学数学与计算机科学学院,江西南昌330038 [2]江西师范大学计算机信息工程学院,江西南昌330022

出  处:《计算机与现代化》2016年第7期91-94,共4页Computer and Modernization

基  金:江西省社会科学规划项目(14TQ04);江西省高校人文社会科学研究项目(TQ1505)

摘  要:随着互联网的发展,网络上产生了大量的舆情文本,提取这些文本的主题可以获取舆情的话题热点和演化趋势。由于舆情文本数据量巨大,并且主题具有随时间动态变化的特点,提出一种加入时间约束先验的LDA主题模型TC-LDA(Time Constrained LDA)。TC-LDA可以将文本数据转化为主题向量,大大降低了文本表示的维度,同时加入时间约束知识后实现了LDA的时序化转换,可以提高LDA捕捉动态主题的能力。实验结果表明,TC-LDA在主题词提取的准确率和召回率上与同类主题模型比较,具有更好的效果。With the development of Internet , a large number of public opinion texts have been produced , and the hot topics and trends can be found by topics extraction from these texts .Because of the huge amount of the texts , and the dynamic changes of topics, a TC-LDA (Time Constrained LDA) model is proposed.TC-LDA can transform the text data into the topic vector and greatly reduce the dimension of public opinion texts , and implements the LDA ’ s timing conversion by adding the time constraint , which can improve the ability of LDA to capture the dynamic topic words .Experiments show that the accuracy and recall rate of TC-LDA is better than that of the similar topic model .

关 键 词:LDA 主题模型 时间约束 主题词 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象