检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京理工大学计算机科学与工程学院,江苏南京210094 [2]淮阴师范学院物理与电子电气工程学院,江苏淮安223300
出 处:《计算机与应用化学》2014年第10期1153-1156,共4页Computers and Applied Chemistry
摘 要:肿瘤是一种多基因参与、多步骤发展、内外环境交互作用下形成的复杂疾病,临床研究显示,对恶性肿瘤而言早期诊断的意义远大于现有的任何一种治疗方案,因此,如何提高肿瘤的诊断率,尤其是早期诊断率已被公认为是改善其疗效和预后的关键。由于蛋白质而并非核酸才是生命活动的具体执行者和体现者,因此,对有关肿瘤的蛋白质质谱数据进行深入研究、挖掘和分析,以期实现肿瘤的早发现,早治疗,在当前显得尤为重要与迫切。因此,本文基于反向传播神经网络对蛋白质质谱数据进行了分析。首先,对蛋白质质谱数据进行了标准化处理,由于蛋白质质谱数据在每个质荷比上的丰度值可能存在较大差异,为防止参与特征提取的各丰度值由于其非均衡性带来的不利影响,因此,在对高维丰度值进行特征提取前,需要对每个丰度值进行标准化处理。又由于质谱数据维数较高,利用主成分分析对数据进行了降维处理,主成分分析属于代数特征分析方法,是模式识别领域中一种经典的特征抽取和降维方法。主成分分析在最小协方差意义下给出了模式样本的最优表示,其优点是消除了模式样本之间的相关性以及实现了模式样本的维数压缩。然后利用反向传播神经网络训练了降维后的数据并进行分类识别。反向传播神经网络的学习规则分为两个阶段:第一阶段(模式顺传播)输入信息从输入层经隐含层逐层计算各单元的输出值,第二阶段(误差逆传播)将输出误差逐层向前算出隐层各单元的误差,并用此误差来修正前层权值。在训练的过程中,即网络的连接权值和闭值被逐步调整,在训练结束之后,网络从输入样本中获得信息并存贮在连接权值和闭值中,根据这些参数和实际样本输入,就可以得到所需要的预测值。本文以卵巢癌质谱数据集为例,通过3个实验来验证本文方法在肿瘤In order to improve the early diagnosis of the tumor, this paper proposes an analytical method of the high-flux protein mass spectrometry based on the BP neural network. Firstly, this method standardizes the data of the protein mass spectrometry. Due to the high dimension of the protein mass spectrometry data, principal component analysis (PCA) is used to reduce the dimension of the data. Secondly, data samples are trained by BP neural network, and test data are finally classified by the learned model. The experimental results show that this method has good stability and high recognition rate.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.191.209.202