检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:胡青渝 刘广臣 HU Qingyu;LIU Guangchen(School of Mathematics&Statistics Science,Ludong University,Yantai,Shandong 264025,China;School of Mathematics&Statistics,Chongqing University,Chongqing 401331,China)
机构地区:[1]鲁东大学数学与统计科学学院,山东烟台264025 [2]重庆大学数学与统计学院,重庆401331
出 处:《计算机工程与应用》2020年第4期247-255,共9页Computer Engineering and Applications
基 金:教育部产学合作协同育人项目(No.201801034031);山东省本科教改面上项目(No.M2018X066);鲁东大学引进人才基金项目(No.LB2017005);国家级大学生创新创业训练计划项目(No.201710451150)
摘 要:针对真核生物DNA序列中蛋白质编码区的识别问题,提出基于深度置信网络(Deep Belief Network,DBN)的组合模型。通过信号处理技术对真核生物的DNA序列进行数值转换,并结合统计学知识提取转换后DNA序列的数值特征;利用随机森林对所提取的特征变量降维;用深度置信网络模型对DNA序列分类判别;根据短时傅里叶变换(Short Time Fourier Transform,STFT)技术对外显子区准确定位。在三个标准测试集上比较组合模型与传统Logistic回归模型、贝叶斯判别模型的判别效果,结果显示,深度置信网络组合模型的准确率和特异度等指标都明显优于Logistic回归模型和贝叶斯判别模型。To identify the protein coding regions in eukaryotic DNA sequences,a combination model based on Deep Belief Network(DBN)is proposed.Firstly,the DNA sequence of eukaryotes is converted numerically by signal processing technology and combined with statistical knowledge to extract the numerical features of the transformed DNA sequence.Secondly,the dimensionality of the extracted features variables is reduced by random forest.Then,the DNA sequence is classified and distinguished by deep belief network model.Finally,the Short Time Fourier Transform(STFT)is used to locate the external exons accurately.The results show that the accuracy and specificity of deep belief network combination model are better than those of Logistic regression model and Bayes discriminant model.
关 键 词:编码区识别 信号处理 随机森林 深度置信网络(DBN) 短时傅里叶变换(STFT)
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.200