检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海海事大学信息工程学院,上海201306 [2]美国罗文大学生物化学系,新泽西08028
出 处:《安徽医科大学学报》2013年第7期725-729,共5页Acta Universitatis Medicinalis Anhui
基 金:国家自然科学基金项目(编号:61271446);上海市科委青年科技启明星计划(A类)(编号:11QA1402900);上海市教委科研创新项目(编号:11YZ141)
摘 要:目的利用改进稀疏非负矩阵分解技术对乳腺癌基因表达谱数据进行双向聚类,挖掘与乳腺癌发病密切相关的基因及其生物过程。方法用小波对22 283个基因的人乳腺癌基因表达数据进行去噪,然后通过T统计初步筛选出5 067个基因作为改进稀疏非负矩阵的输入矩阵,进行双向聚类进一步筛选出81个与乳腺癌密切相关的显著基因,最后通过cytoscape对81个与乳腺癌密切相关的显著基因构建生物过程结构图。结果筛选出与乳腺癌相关的基因、可能相关的基因以及这些基因参与的生物过程之间的关系。结论改进稀疏非负矩阵分解与现存的其他非负矩阵分解算法相比具有聚类效果好、稳定性强且迭代次数少的优点,适合于乳腺癌差异表达基因的提取。Objective To biocluster breast cancer gene expression profiles by improved sparse non-negative matrix factorization( sparse non-negative matrix factorization, SparseNMF), and to dig out the related genes and biological processes of breast cancer. Methods With wavelet to preprocess 22 283 human breast cancer gene expression profiles data for removing noise by T test screening out 5 067 genes preliminary, then to chose 81 significant genes of breast cancer by improved SparseNMF bioclustering, then construct the biological processes structure where the 81 significant genes involved. Results The significant genes, related gene of breast cancer and these genes invol- ving in biological processes were screened out. Conclusion The proposed sparse NMF algorithm often achieves better clustering performance and stability with shorter computing time to other existing NMF algorithms, fitting to extract breast cancer significant genes.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28