检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈励[1,2] 王顺芳[1,2] 孟捷 唐瑛[1,2]
机构地区:[1]云南大学统计系 [2]云南教育学院数理分院
出 处:《云南大学学报(自然科学版)》1998年第6期432-436,共5页Journal of Yunnan University(Natural Sciences Edition)
基 金:云南省应用基础研究基金
摘 要:从语言学的角度来看基因序列,一个DNA序列可以看成是由字母A,G,C,T组成的有限的字符串,以一定的语法和词法结构为转录机器所识别.那么,词在序列中是如何分布的?文中研究了在不同状况下的单词的理论分布,证实了单词(即CODE)的自重叠性对单词在序列中的概率分布的有极大的影响,并就实例验证了这一点.结合经验分布,提出了两种在DNA序列中鉴别异常单词的方法.得出结论:字母A,G,C,T等概率出现和不等概率出现是判别单词是否异常的重要条件.A linguistic approaches to understanding the meaning of DNA sequence have been adopted.A DNA sequence is composed of nucleotides A,C,G,T,and can be transferred under a special ‘morphology’ and ‘grammar’.Which factors will influence the number of the occurrences of words in the DNA text?How to find the ‘anomalous’ words?The theoretic probability distribution of the words is got.And it reveals the highly influence of overlapping capability on the probability distribution.The effect is illustrated with a DNA fragment example.Going with empirical distribution,two ways are presented to find ‘anomalous’ words.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249