检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]江西科技师范大学数学与计算机科学学院,江西南昌330038 [2]江西师范大学计算机信息工程学院,江西南昌330022
出 处:《计算机与现代化》2016年第7期91-94,共4页Computer and Modernization
基 金:江西省社会科学规划项目(14TQ04);江西省高校人文社会科学研究项目(TQ1505)
摘 要:随着互联网的发展,网络上产生了大量的舆情文本,提取这些文本的主题可以获取舆情的话题热点和演化趋势。由于舆情文本数据量巨大,并且主题具有随时间动态变化的特点,提出一种加入时间约束先验的LDA主题模型TC-LDA(Time Constrained LDA)。TC-LDA可以将文本数据转化为主题向量,大大降低了文本表示的维度,同时加入时间约束知识后实现了LDA的时序化转换,可以提高LDA捕捉动态主题的能力。实验结果表明,TC-LDA在主题词提取的准确率和召回率上与同类主题模型比较,具有更好的效果。With the development of Internet , a large number of public opinion texts have been produced , and the hot topics and trends can be found by topics extraction from these texts .Because of the huge amount of the texts , and the dynamic changes of topics, a TC-LDA (Time Constrained LDA) model is proposed.TC-LDA can transform the text data into the topic vector and greatly reduce the dimension of public opinion texts , and implements the LDA ’ s timing conversion by adding the time constraint , which can improve the ability of LDA to capture the dynamic topic words .Experiments show that the accuracy and recall rate of TC-LDA is better than that of the similar topic model .
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3