使用LSA降维的改进ART2神经网络文本聚类  被引量:4

Improved ART2 neural network for text clustering based on LSA

在线阅读下载全文

作  者:徐晨凯[1] 高茂庭[1] 

机构地区:[1]上海海事大学信息工程学院,上海201306

出  处:《计算机工程与应用》2014年第24期133-138,177,共7页Computer Engineering and Applications

基  金:上海市科委科技创新项目(No.12595810200);上海海事大学科研项目(No.201100051)

摘  要:针对文本数据高维度的特点和聚类的动态性要求,结合隐含语义分析(LSA)降维,提出一种改进的ART2神经网络文本聚类算法,通过LSA凸显文本和词条之间的语义关系,减少无用噪声,降低数据维度和计算复杂性;采用改进的折中学习方法,减少计算步骤,加快ART2神经网络计算速度,并利用最近邻动态重组方法提高ART2网络聚类的稳定性,减弱算法对样本输入顺序的依赖。实验表明,改进的文本聚类算法能有效地实现动态文本聚类。In order to realize dynamic clustering for high-dimensional text data, an improved ART2 neural network text clustering algorithm based on Latent Semantic Analysis(LSA)is proposed, which emerges the semantic relations between texts and terms and reduces the noises, the dimensionality and the computation complexity by LSA. The new algorithm uses an improved intermediate learning method to simplify calculating procedures and accelerate the computation of the ART2 network, and uses the nearest neighbor reformation to improve the stability and weaken the dependence of samples order for the ART2 network clustering. Experiments demonstrate that this improved algorithm can realize dynamic text clustering effectively.

关 键 词:ART2神经网络 最近邻 隐含语义分析(LSA) 降维 文本聚类 聚类分析 

分 类 号:TP183[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象