检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:施维[1] 王兴华 万巍[1] 薛均[1] 潘璀然 程显毅[2] 董建成[1] 王理[1]
机构地区:[1]南通大学医学院,南通226001 [2]南通大学计算机科学与技术学院,南通226001
出 处:《江苏科技大学学报(自然科学版)》2017年第6期768-773,共6页Journal of Jiangsu University of Science and Technology:Natural Science Edition
基 金:国家自然科学基金项目(81271668);江苏省高校自然科学研究项目(14KJB310014);南通市科技计划资助项目(MS12015112);江苏省研究生科研实践创新计划项目(KYCX17-1932)
摘 要:针对特定主题的微博文本进行聚类以发现潜在话题.基于深度学习的文本特征表示方法,并运用分布式计算平台提高了计算的效率。对竞争学习聚类算法进行介绍,提出了通过目标函数来分析聚类结果的好坏,通过评价实验得到的聚类结果,81.5%的聚类类别良好,说明竞争学习的聚类算法可以有效应用于大规模短文本.In order to find latent topics in large-scaled microblog,this research provides competitive learning method. Firstly,representation of text feature based on deep learning model is presented. At the same time,in order to improve the efficiency of calculation,distributed computing platform is used. Secondly,competitive learning clustering algorithm is introduced. To analyze the result of clustering,objective function is proposed. In the end,experimental results show that 81. 5 % of the clustering result is good,which can prove that competitive learning makes large scale clustering efficiently.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117