检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]安徽财经大学信息工程学院,安徽蚌埠233041 [2]华南师范大学计算机学院,广东广州510631
出 处:《计算机应用与软件》2007年第5期60-62,共3页Computer Applications and Software
基 金:安徽省教育厅自然科学基金项目(2005KJ051)。
摘 要:聚类分析是数据挖掘领域广泛使用的一种技术,可以自动发现隐含在数据集中的分类模式。学分制体系下的学生选课数据可以看作分类属性的数据或布尔型数据。研究表明,使用距离作为测度的传统聚类算法并不适合处理这类数据。在分析数据集特点的基础上,提出了一个新的聚类算法,它用公共近邻点数来衡量两数据间的相似性,这样有利于考虑数据分布的全局特征,具有良好的聚类特性和可扩展性。通过在开发的模型系统上进行实验分析,得到了较好的实验结果,对较好解决学分制体系下学生专业自动分类问题具有积极意义。Clustering is a widely used technique for discovering categorical patterns in underlying data in data miming. There exist quite a lot of course-selecting data in credit system,which can be viewed as data with categorical attributes or boolean data. Researches show it is inappropriate to process these datawith a traditional clustering algorithm in which distance is used as a measure. Based on the characteristics analysis of data sets, the author puts forwards a new algorithm in which data similarity is measured with common adjacent points, thus global characteristics of data distribution are taken into account, good clustering property and expandability are achieved, and credit-system-based automatic speciality classification is realized. Experimental analysis is carried out on a developed system modelwith good experimental results.
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.94