反向传播神经网络的蛋白质质谱高通量分析方法研究(英文)  被引量:1

The analysis of high-flux protein mass spectrometry based on BP neural network

在线阅读下载全文

作  者:邹修明[1,2] 孙怀江[1] 

机构地区:[1]南京理工大学计算机科学与工程学院,江苏南京210094 [2]淮阴师范学院物理与电子电气工程学院,江苏淮安223300

出  处:《计算机与应用化学》2014年第10期1153-1156,共4页Computers and Applied Chemistry

摘  要:肿瘤是一种多基因参与、多步骤发展、内外环境交互作用下形成的复杂疾病,临床研究显示,对恶性肿瘤而言早期诊断的意义远大于现有的任何一种治疗方案,因此,如何提高肿瘤的诊断率,尤其是早期诊断率已被公认为是改善其疗效和预后的关键。由于蛋白质而并非核酸才是生命活动的具体执行者和体现者,因此,对有关肿瘤的蛋白质质谱数据进行深入研究、挖掘和分析,以期实现肿瘤的早发现,早治疗,在当前显得尤为重要与迫切。因此,本文基于反向传播神经网络对蛋白质质谱数据进行了分析。首先,对蛋白质质谱数据进行了标准化处理,由于蛋白质质谱数据在每个质荷比上的丰度值可能存在较大差异,为防止参与特征提取的各丰度值由于其非均衡性带来的不利影响,因此,在对高维丰度值进行特征提取前,需要对每个丰度值进行标准化处理。又由于质谱数据维数较高,利用主成分分析对数据进行了降维处理,主成分分析属于代数特征分析方法,是模式识别领域中一种经典的特征抽取和降维方法。主成分分析在最小协方差意义下给出了模式样本的最优表示,其优点是消除了模式样本之间的相关性以及实现了模式样本的维数压缩。然后利用反向传播神经网络训练了降维后的数据并进行分类识别。反向传播神经网络的学习规则分为两个阶段:第一阶段(模式顺传播)输入信息从输入层经隐含层逐层计算各单元的输出值,第二阶段(误差逆传播)将输出误差逐层向前算出隐层各单元的误差,并用此误差来修正前层权值。在训练的过程中,即网络的连接权值和闭值被逐步调整,在训练结束之后,网络从输入样本中获得信息并存贮在连接权值和闭值中,根据这些参数和实际样本输入,就可以得到所需要的预测值。本文以卵巢癌质谱数据集为例,通过3个实验来验证本文方法在肿瘤In order to improve the early diagnosis of the tumor, this paper proposes an analytical method of the high-flux protein mass spectrometry based on the BP neural network. Firstly, this method standardizes the data of the protein mass spectrometry. Due to the high dimension of the protein mass spectrometry data, principal component analysis (PCA) is used to reduce the dimension of the data. Secondly, data samples are trained by BP neural network, and test data are finally classified by the learned model. The experimental results show that this method has good stability and high recognition rate.

关 键 词:肿瘤早期诊断 反向传播神经网络 主成分分析 蛋白质质谱分析 

分 类 号:Q71[生物学—分子生物学] TQ015.9[化学工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象