检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]太原理工大学计算机科学与技术学院,山西太原030024 [2]山西煤炭职业技术学院,山西太原030031
出 处:《山西师范大学学报(自然科学版)》2011年第2期45-49,共5页Journal of Shanxi Normal University(Natural Science Edition)
基 金:山西省自然科学基金资助项目(2008011040)
摘 要:在web挖掘的聚类分析中,类与类之间不一定存在清晰的边界.而且由于web浏览过程和web日志内存在各种各样的原因,存在大量错误的或不完全的数据的可能性很高,因此许多研究者使用模糊理论的方法对web数据进行聚类分析.本文提出了基于粗糙理论的粗糙k-均值的聚类方法,在聚类过程中,每个web事务被转换成等长的向量形式,并给出它们的相似性度量,而且每个类由一个边界模糊的粗糙集来表示,然后利用改进的粗糙k-均值法对web事务进行聚类.最后给出了实例说明和实验分析.The clusters in web mining do not necessarily have crisp boundaries in web mining clustering application.Moreover,due to a variety of reasons inherent in web browsing and web logging,the likelihood of bad or incomplete data is higher.Many researchers proposed fuzzy algorithms to cluster web data with fuzzy theory.Clustering web transactions by using rough set theory is studied in this paper.Each web transaction is transformed as a corresponding vector with same length.And similarity between any two web transactions is defined.In addition,every cluster is denoted by a rough set.Then a modified rough k-means is adopted to cluster user access patterns.Finally,an example and experiment are given to illustrate the proposed algorithm.
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.217.52.224