检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨峻山[1] 纪震[1] 谢维信[1] 朱泽轩[2]
机构地区:[1]深圳大学信息工程学院,广东深圳518060 [2]深圳大学计算机与软件学院,广东深圳518060
出 处:《深圳大学学报(理工版)》2016年第3期264-271,共8页Journal of Shenzhen University(Science and Engineering)
基 金:国家自然科学基金资助项目(61171125;61471246)~~
摘 要:针对生物组学数据普遍存在的高维小样本和样本分布不平衡问题,提出基于粒子群优化分类模型选择算法.该算法中粒子编码由样本平衡模型、特征选择模型和分类模型及超参数构成,粒子种群以达到以生物组学数据最佳分类性能为目标,通过对粒子的速度和位置进行迭代更新,得到模型组合及超参数的最优解.在8组真实生物组学数据集上的实验结果表明,所提模型选择算法能够避免人为选择所带来的主观偏差,提高最佳分类性能和稳定性.A new model selection algorithm based on particle swarm optimization is proposed for omics data classification. Specifically,the algorithm is designed to handle the high dimensionality,small sample size and class imbalance problems that are inherent in omics data. The particles encode candidate combinations of data sampling,feature selection,classification models and their corresponding parameter settings. The swarm optimization is targeted at the best classification performance. The particle velocity and position are iteratively updated until some stopping criteria are met and then the optimal solution model combination is output. The simulation results on eight real-world omics datasets show that the proposed model selection algorithm is capable of avoiding the bias introduced by manual settings and leading to accurate and reliable classification performance.
关 键 词:生物组学 粒子群优化 样本平衡 特征选择 分类模型 模型选择 数据挖掘
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222