检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李文举[1] 梅丽[1] 信润海[1] 韦丽华[1]
机构地区:[1]辽宁师范大学计算机与信息技术学院,辽宁大连116081
出 处:《辽宁师范大学学报(自然科学版)》2010年第1期42-45,共4页Journal of Liaoning Normal University:Natural Science Edition
基 金:辽宁省博士科研启动基金项目(20061052)
摘 要:人类基因启动子预测和识别是DNA序列分析中的一项重要任务.提出了一个基于KL散度和BP神经网络的人类基因启动子识别算法.利用KL散度提取分辨力最强的六联体来区分启动子和非启动子区域,将这些六联体的出现频率作为识别启动子的组成成分特征,结合CpG岛特征,应用BP神经网络技术建立人类启动子识别系统.该系统有3个分类器,即启动子-外显子分类器,启动子-内含子分类器和启动子-3’UTR分类器,每个分类器都是一个BP神经网络,通过3个分类器的结果来综合预测启动子序列.对测试集的实验结果为:敏感性达到51.4%,特异性达到52.9%.Promoter prediction and recognition in human genome is an important task in DNA sequence analysis. We present a novel human promoter recognition algorithm based on KL divergence and BP neural network. We extract the most effective 6-mers that distinguish promoter sequenec regions from other DNA sequences regions by KL divergence,and choose frequencies of the 6-mers as the compo- nent features. We combine the component features and CpG island features,and then apply BP neural network to construct a human promoter recognition system. The system consists of three classifiers: Promoter-Exon classifier, Promoter-Intron classifier and Promoter-3 '-UTR classifier. Each classifier is a BP neural network. If an unknown sequence is regarded as a promoter by two or three classifiers, it is predicted as a promoter. The evaluation results on testing set are 51.40% in sensitivity and 52.9 % in specificity.
关 键 词:启动子识别 组成成分特征 CPG岛 KL散度 BP神经网络
分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145