基于聚类分析策略的Web文本挖掘方法  被引量:1

A Web Text Mining Method Based on Cluster Analysis Strategy

在线阅读下载全文

作  者:刘彦保[1] 王文发[1] 王文东[1] 

机构地区:[1]延安大学数学与计算机科学学院,陕西延安716000

出  处:《延安大学学报(自然科学版)》2007年第4期22-25,29,共5页Journal of Yan'an University:Natural Science Edition

摘  要:在分析Web文本挖掘过程、关键技术的基础上,针对训练文本集中往往存在多个主题类别的问题,提出一种基于聚类分析策略的Web文本挖掘方法。其基本思路是对训练文档集进行聚类处理,然后对同主题文档进行共性分析,并经过特征权值调整和特征约减,从而获得表示用户不同主题感兴趣概念向量。On the basis of analysis of Web text mining process and the relative key technique, this paper puts forward a Web text mining method based on cluster analysis strategy, aiming at the problem of the many subject category in text cluster training. The basic idea is to cluster the training documents, then analyze the commonness of the documents of the same subject. After feature weight modification and feature reduction, the interested concept vector of different user is obtained.

关 键 词:WEB挖掘 文本挖掘 聚类分析 特征向量 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象