基于潜在语义分析和自组织特征映射神经网络的文本聚类研究  被引量:3

Research on Text Clustering Based on LSA-SOM

在线阅读下载全文

作  者:王剑锋[1] 麻丽娜[1] 李新叶[1] 乔冬[1] 

机构地区:[1]华北电力大学科技学院,河北保定071051

出  处:《计算机与现代化》2010年第2期77-79,共3页Computer and Modernization

基  金:华北电力大学青年教师科研基金资助项目(200811036)

摘  要:基于潜在语义分析和自组织特征映射神经网络(LSA-SOM),本文提出一种文本聚类方法。采用潜在语义分析的理论表示文本特征向量,以体现特征词的语义关系并实现特征向量的降维。利用SOM网络算法进行无监督自组织学习,并通过不断调节网络节点间的权向量来实现文本聚类。该方法不必预先给定聚类个数,可以在任意合适的位置生成一个新的类,克服传统方法中文本种类需要预先给定的缺点。A text clustering method based on LSA-SOM is proposed. The text eigenveetor is represented by Latent Senmntie Analysis (LSA), wlfich embodies the senmntic relation of the eigen words, and realizes the dimension reduction of the eigenvector. SOM network algorithm is used to non-supervised self-organizing study, and the weight vectors of neural network are continuously adjusted in order to achieving the cluster targets. It requires no predefined number of clusters and can create a new species of text in any right position, and remedies the defect of traditional methods.

关 键 词:自组织特征映射神经网络 潜在语义分析 文本聚类 

分 类 号:TP301.2[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象