基于多视角聚类模型的微博文本数据挖掘算法研究  被引量:2

Data Mining Algorithm Based on Multi-view Clustering Model

在线阅读下载全文

作  者:陈兰兰[1] 胡细玲[1] 

机构地区:[1]江西财经职业学院信息工程学院,江西九江332000

出  处:《科技通报》2017年第11期129-132,共4页Bulletin of Science and Technology

摘  要:本文提出了一种能够同时考虑关键词和发生时间的新型算法。该算法首先对数据预处理后,建立微博事件集合的LDA模型,生成主题词集合作为事件的描述标志,通过DTW算法对事件关键词间的语义、时序相似度进行计算,得到对应的相似度矩阵,最后采用协同训练普聚类方法,迭代生成最终的特征向量并完成事件选取。仿真实验结果表明,本文提出的算法同以往算法相比具有准确率高以及效率高的特点。This paper proposes a new algorithm can simultaneously consider keywords and time, the algorithm firstly after data preprocessing, weibo event collection of LDA model, generates keywords set as the symbol, the description of the event by DTW algorithm for event keyword semantic, sequence similarity calculation, get the corresponding similarity matrix, finally USES the clustering method, the joint training where the iteration to produce the final feature vector and complete the event selection. The simulation results show that the proposed algorithm has high accuracy and efficiency compared with previous algorithms.

关 键 词:微博文本 文本数据挖掘 多视角 相似矩阵 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象