检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机工程与应用》2014年第24期133-138,177,共7页Computer Engineering and Applications
基 金:上海市科委科技创新项目(No.12595810200);上海海事大学科研项目(No.201100051)
摘 要:针对文本数据高维度的特点和聚类的动态性要求,结合隐含语义分析(LSA)降维,提出一种改进的ART2神经网络文本聚类算法,通过LSA凸显文本和词条之间的语义关系,减少无用噪声,降低数据维度和计算复杂性;采用改进的折中学习方法,减少计算步骤,加快ART2神经网络计算速度,并利用最近邻动态重组方法提高ART2网络聚类的稳定性,减弱算法对样本输入顺序的依赖。实验表明,改进的文本聚类算法能有效地实现动态文本聚类。In order to realize dynamic clustering for high-dimensional text data, an improved ART2 neural network text clustering algorithm based on Latent Semantic Analysis(LSA)is proposed, which emerges the semantic relations between texts and terms and reduces the noises, the dimensionality and the computation complexity by LSA. The new algorithm uses an improved intermediate learning method to simplify calculating procedures and accelerate the computation of the ART2 network, and uses the nearest neighbor reformation to improve the stability and weaken the dependence of samples order for the ART2 network clustering. Experiments demonstrate that this improved algorithm can realize dynamic text clustering effectively.
关 键 词:ART2神经网络 最近邻 隐含语义分析(LSA) 降维 文本聚类 聚类分析
分 类 号:TP183[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.147.83.1