检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京警察学院,北京102202 [2]中国人民公安大学,北京100038
出 处:《网络安全技术与应用》2014年第4期5-6,共2页Network Security Technology & Application
摘 要:微博是近年出现的新型社交媒体形式,具有内容碎片化、传播方式快捷迅速、交互性强等自身特点。传统的向量空间模型难以准确度量文本间的相似度,本文使用LDA主题模型可以有效解决数据稀疏性问题,并通过聚类算法最终发现热点话题。As a new fomas of social media, Micro-blog has its characteristics, such as content fragmentation, quich speak way and interractive.The tradional Vector Space Model( VSM )can't accurately measure the similariW of the texts.This passage presents a model based on latent dirichlet allocation ( LDA ) to reduce the sparseness of short texts and finally obtain the hot topic through k-means clustering.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117