检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]哈尔滨医科大学卫生统计学教研室,150001
出 处:《中国卫生统计》2006年第6期491-494,共4页Chinese Journal of Health Statistics
基 金:国家自然科学基金资助(30371253);黑龙江省重点项目(GB04C30202)
摘 要:目的探讨随机森林算法在基因表达数据分类研究中的应用。方法通过实际基因表达数据考核其应用效果,并通过模拟试验进一步验证和研究在存在大量无差异表达基因情况下对分类产生的影响。结果随机森林算法对基因表达数据的分类具有较高的准确性,但随着基因数量的增加其判别效果呈下降的趋势,在差异表达基因之间具有相关性时,下降趋势明显减慢,能够获得较理想的分类效果。结论随机森林算法对基因表达数据的分类研究有较好的判别效果。Objective We investigate the use of random forests for classification of gene expression data. Methods The method is applied to real datasets. The result of simulated experiment validation shows the effect of classification with many undifferentiated expressed genes. Results Random Forests preserves excellent performance in class prediction with gene expression data but decline exists when the number of genes increases. We can obtain better predictive accuracy that the decline is slower when differentially expressed genes are related. Conclusion Random Forests possesses excellent performance in the classification of gene expression data.
分 类 号:R195[医药卫生—卫生统计学]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.38