基于粗糙k-均值的web事务的聚类  

Clustering Web Transactions based on Rough k-means

在线阅读下载全文

作  者:曹棣[1] 孔晓斌[2] 

机构地区:[1]太原理工大学计算机科学与技术学院,山西太原030024 [2]山西煤炭职业技术学院,山西太原030031

出  处:《山西师范大学学报(自然科学版)》2011年第2期45-49,共5页Journal of Shanxi Normal University(Natural Science Edition)

基  金:山西省自然科学基金资助项目(2008011040)

摘  要:在web挖掘的聚类分析中,类与类之间不一定存在清晰的边界.而且由于web浏览过程和web日志内存在各种各样的原因,存在大量错误的或不完全的数据的可能性很高,因此许多研究者使用模糊理论的方法对web数据进行聚类分析.本文提出了基于粗糙理论的粗糙k-均值的聚类方法,在聚类过程中,每个web事务被转换成等长的向量形式,并给出它们的相似性度量,而且每个类由一个边界模糊的粗糙集来表示,然后利用改进的粗糙k-均值法对web事务进行聚类.最后给出了实例说明和实验分析.The clusters in web mining do not necessarily have crisp boundaries in web mining clustering application.Moreover,due to a variety of reasons inherent in web browsing and web logging,the likelihood of bad or incomplete data is higher.Many researchers proposed fuzzy algorithms to cluster web data with fuzzy theory.Clustering web transactions by using rough set theory is studied in this paper.Each web transaction is transformed as a corresponding vector with same length.And similarity between any two web transactions is defined.In addition,every cluster is denoted by a rough set.Then a modified rough k-means is adopted to cluster user access patterns.Finally,an example and experiment are given to illustrate the proposed algorithm.

关 键 词:WEB挖掘 聚类分析 粗糙集 粗糙K-均值 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象