基于改进稀疏非负矩阵分解方法的乳腺癌微阵列表达数据分析  被引量:6

Breast cancer genes expression data analysis based on improved sparse matrix factorization techniques

在线阅读下载全文

作  者:孔薇[1] 王娟[1] 牟晓阳[2] 

机构地区:[1]上海海事大学信息工程学院,上海201306 [2]美国罗文大学生物化学系,新泽西08028

出  处:《安徽医科大学学报》2013年第7期725-729,共5页Acta Universitatis Medicinalis Anhui

基  金:国家自然科学基金项目(编号:61271446);上海市科委青年科技启明星计划(A类)(编号:11QA1402900);上海市教委科研创新项目(编号:11YZ141)

摘  要:目的利用改进稀疏非负矩阵分解技术对乳腺癌基因表达谱数据进行双向聚类,挖掘与乳腺癌发病密切相关的基因及其生物过程。方法用小波对22 283个基因的人乳腺癌基因表达数据进行去噪,然后通过T统计初步筛选出5 067个基因作为改进稀疏非负矩阵的输入矩阵,进行双向聚类进一步筛选出81个与乳腺癌密切相关的显著基因,最后通过cytoscape对81个与乳腺癌密切相关的显著基因构建生物过程结构图。结果筛选出与乳腺癌相关的基因、可能相关的基因以及这些基因参与的生物过程之间的关系。结论改进稀疏非负矩阵分解与现存的其他非负矩阵分解算法相比具有聚类效果好、稳定性强且迭代次数少的优点,适合于乳腺癌差异表达基因的提取。Objective To biocluster breast cancer gene expression profiles by improved sparse non-negative matrix factorization( sparse non-negative matrix factorization, SparseNMF), and to dig out the related genes and biological processes of breast cancer. Methods With wavelet to preprocess 22 283 human breast cancer gene expression profiles data for removing noise by T test screening out 5 067 genes preliminary, then to chose 81 significant genes of breast cancer by improved SparseNMF bioclustering, then construct the biological processes structure where the 81 significant genes involved. Results The significant genes, related gene of breast cancer and these genes invol- ving in biological processes were screened out. Conclusion The proposed sparse NMF algorithm often achieves better clustering performance and stability with shorter computing time to other existing NMF algorithms, fitting to extract breast cancer significant genes.

关 键 词:乳腺癌 非负矩阵分解 基因表达谱数据 

分 类 号:Q343.1[生物学—遗传学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象