结合正则化方法的区块森林在癌症多组学数据预后预测中的应用研究  被引量:1

在线阅读下载全文

作  者:兰宁 张永超 李淼 赵晋芳[1] 罗天娥[1] 

机构地区:[1]山西医科大学卫生统计教研室,030001 [2]中国医学科学院血液病医院

出  处:《中国卫生统计》2023年第3期382-385,共4页Chinese Journal of Health Statistics

基  金:山西省自然科学基金(201801D121210)。

摘  要:目的探讨区块森林模型结合正则化降维方法在癌症多组学数据中的预后预测效果。方法通过模拟数据与实际肺腺癌多组学数据,使用自适应弹性网正则化方法对数据进行降维,降维后对比区块森林模型与随机生存森林模型预后预测的不同,采用C指数作为两种模型泛化能力的评价指标。结果模拟实验表明,在不同的模拟条件下,区块森林模型预测准确度均高于随机生存森林模型,且结合正则化方法后可改善模型过拟合。实例分析显示结合正则化的区块森林模型测试集平均C指数为0.890±0.021高于随机生存森林模型,预测结果差异具有统计学意义(P<0.001)。结论区块森林模型通过引入“块选择”的随机过程,结合正则化进行降维,能够更好地适应多组学数据的复杂结构,提高预测性能。

关 键 词:区块森林 正则化 多组学 预后预测 

分 类 号:R195.1[医药卫生—卫生统计学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象