检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《畜牧兽医学报》2009年第2期180-184,共5页ACTA VETERINARIA ET ZOOTECHNICA SINICA
基 金:国家自然科学基金(30771534);教育部"长江学者和创新团队发展计划";"猪抗病营养的分子机制"团队项目(IRT0555-6)
摘 要:就基因芯片数据聚类分析中广泛应用的K-means算法对常见的2种类型的基因芯片数据上的应用进行研究。结果表明,不同类型的基因芯片数据适用于不同的预处理方式和不同的相似度。对于时间序列数据集,对数化转换后,相似度选择协方差所得结果最好。对于非时间序列数据集,对数转化最好,相似度选取欧氏距离、平方欧氏距离、马氏距离都比较好。The effects of different measuring metrics and data preprocessing for different gene expression data on K-means clustering were studied. The results illustrated that different data preprocessing ways made significant differences under different measuring metrics. The best data preprocessing in K means clustering was to select log transformations for the time-course gene expression dataset, and measuring metrics is to select covariance metrics. However, the best data preprocessing is log transformations for other datasets, three measuring metrics (Euclidean distance, squared Euclidean distance and Manhattan distance) led to better results.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.235