检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:谭云[1] 于彬[2] 王琦然 王学敏[2] 李珊[2] 邱文莹
机构地区:[1]青岛职业技术学院生物与化工学院,青岛266555 [2]青岛科技大学数理学院,青岛266061
出 处:《重庆理工大学学报(自然科学)》2016年第6期102-108,共7页Journal of Chongqing University of Technology:Natural Science
基 金:国家自然科学基金资助项目(41204115);山东省自然科学基金资助项目(ZR2013AM007;ZR2014FL021);山东省高等学校科技计划项目(J13LI54)
摘 要:提出一种基于支持向量机的肿瘤基因表达谱数据挖掘方法。首先采用信噪比方法对白血病、结肠癌、肺癌数据提取特征基因,生成特征基因子集。然后通过支持向量机分类模型对特征基因子集进行机器学习训练分类。实验结果表明:急性白血病、结肠癌只需4个特征基因,均获得100%的10折交叉验证分类准确率。最后为了有效地排除噪声基因进而挑选出精确度更高的分类特征基因,采用多尺度小波阈值法对肺癌数据进行降噪处理,降噪后仅需5个特征基因获得96.61%的分类准确率。This paper put forward cancer gene expression profile data mining methods based on support vector machine( SVM). Firstly,informative genes were extracted from leukemia,colon cancer and lung cancer data by signal-to-noise ratio method, thus generating informative genes subsets. Then informative genes subsets were classified by machine learning and training through support vector machine( SVM) classification model. The experimental results show that only fourinformative genes are needed for acute leukemia and colon cancer to get 100% classification accuracy by 10 fold cross-validation. Finally,multi-scale wavelet threshold denoising method was established to reduce the noise of the data in lung cancer gene expression profiles for getting higher classification accuracy. After noise reduction,only five informative genes are needed to get 96. 61% classification accuracy.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.146