检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:廖志芳[1] 樊晓平[1] 陈宇宙[1] 廖志宁[2] 瞿志华[1,3]
机构地区:[1]中南大学信息科学与工程学院,长沙410075 [2]英国莱斯特郡拉夫堡大学科学学院计算机系,LE113TU,UK [3]美国奥兰多中弗罗里达大学电子工程与计算机学院,FL 32816,USA
出 处:《计算机工程与应用》2008年第20期208-211,共4页Computer Engineering and Applications
基 金:国家自然科学基金(the National Natural Science Foundation of China under Grant No.60776834);湖南省自然科学基金(the Natural Science Foundation of Hunan Province of China under Grant No.06JJ50143)
摘 要:数据分类是数据挖掘技术在医疗数据分析中的一个重要应用,在分析了医疗数据特点后,以大肠早癌诊断数据为例,提出了利用计数最近邻算法对其进行分类的思想;同时在分析该算法性能的基础上,提出了基于检索树和样本密度的计数最近邻新算法对改数据进行分析,以检索树的构建来提高原算法的计算效率,基于全局密度、K-密度的改进算法来提高原算法的精确度。通过实验证明新算法在大肠早癌的数据分析中,其计算复杂度、存储空间和数据分类精确度都得到了较大的提高,同时新算法适应于数值数据、文本数据以及混合数据的分类。Data classification is an important data mining role in biomedicine.This paper proposes a method to analyze Colorectal Carcinoma diagnosis data based on counting KNN algorithm after analyzing the characteristics of biomedicine data.Though the count-weight-k-nearest neighbours for classification is simple and effective,it doesn't deal with biomedicine data well.After analyzing the algorithm performance,an novel counting KNN algorithm by index tree and sample density is presented.The new method improves the accuracy of classification by using different algorithms of overall density and K-local density,and also improves efficiency by using a tree structure index.Experimefits show that this method outperforms the distance-based voting KNN, and CwKNN.More importantly it is a single method that works for ordinal,nominal or mixed data.
关 键 词:大肠早癌诊断数据 计数最近邻算法 全局密度 K-密度
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229