时序基因表达缺失值的加权双向回归估计算法  被引量:4

Double Weighted Regression Estimation for Missing Values in Time Series Gene Expression Data

在线阅读下载全文

作  者:李建更[1] 郭庆雷[1] 贺益恒[1] 

机构地区:[1]北京工业大学人工智能与机器人研究所,北京100124

出  处:《数据采集与处理》2013年第2期136-140,共5页Journal of Data Acquisition and Processing

基  金:北京市教育委员会科技计划(JC002011200903)资助项目;水体污染控制与治理重大专项--南水北调中线总干渠水质安全保障关键技术与工程示范(2009ZX07212-003)资助项目

摘  要:由于受实验条件等客观因素制约,实验所得到的基因表达谱数据存在数据缺失的现象,不利于数据的后续使用。如何在不丢失数据信息、不影响数据整体使用的情况下,对实验数据进行估计、填充已成为目前生物信息学研究的热点。本文通过利用核加权函数提取与缺失值所在的行列具有最大相似性的行列信息,提出了基于双向核加权回归估计的算法。在回归过程中同时考虑基因表达的空间相关性和时间相关性信息,使回归算法使用的信息更加充分。通过与其他缺失值估计算法相比较,加权双向回归算法的估计结果较好。Due to the limited experimental condition, there are missing values in gene expres-sion data which make the following use difficult. Estimating missing values without data de-stroy and information lost has become an important work of bio-information. By weighted ker-nel function, it can find out rows and columns having largest similar coefficient with the rows and columns containing missing values. An estimation method based on double weighted re- gression is introduced by using weighted kernel function. It makes the information data more abundant by considering gene space correlation and time correlation in regression. Comparing with other methods, the weighted double regression method can obtain better estimation result.

关 键 词:时序基因表达 空间相关性 时间相关性 加权双向回归 缺失值估计 

分 类 号:Q786[生物学—分子生物学] O212[理学—概率论与数理统计]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象