检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京工业大学人工智能与机器人研究所,北京100124
出 处:《数据采集与处理》2013年第2期136-140,共5页Journal of Data Acquisition and Processing
基 金:北京市教育委员会科技计划(JC002011200903)资助项目;水体污染控制与治理重大专项--南水北调中线总干渠水质安全保障关键技术与工程示范(2009ZX07212-003)资助项目
摘 要:由于受实验条件等客观因素制约,实验所得到的基因表达谱数据存在数据缺失的现象,不利于数据的后续使用。如何在不丢失数据信息、不影响数据整体使用的情况下,对实验数据进行估计、填充已成为目前生物信息学研究的热点。本文通过利用核加权函数提取与缺失值所在的行列具有最大相似性的行列信息,提出了基于双向核加权回归估计的算法。在回归过程中同时考虑基因表达的空间相关性和时间相关性信息,使回归算法使用的信息更加充分。通过与其他缺失值估计算法相比较,加权双向回归算法的估计结果较好。Due to the limited experimental condition, there are missing values in gene expres-sion data which make the following use difficult. Estimating missing values without data de-stroy and information lost has become an important work of bio-information. By weighted ker-nel function, it can find out rows and columns having largest similar coefficient with the rows and columns containing missing values. An estimation method based on double weighted re- gression is introduced by using weighted kernel function. It makes the information data more abundant by considering gene space correlation and time correlation in regression. Comparing with other methods, the weighted double regression method can obtain better estimation result.
关 键 词:时序基因表达 空间相关性 时间相关性 加权双向回归 缺失值估计
分 类 号:Q786[生物学—分子生物学] O212[理学—概率论与数理统计]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30